数据分析
LK2W
这个作者很懒,什么都没留下…
展开
-
如何利用OMIM数据库获取肿瘤相关所有突变基因?
如何利用OMIM数据库获取肿瘤相关所有突变基因?OMIM是人类孟德尔遗传数据库(线上版)(0nline Mendelian Inheritance in Man)的简称。这是一个持续更新的关于人类基因和遗传紊乱的数据库,主要着眼于遗传性的基因疾病,包括文本信息和相关参考信息、序列纪录、图谱和相关其他数据库(度娘有介绍,此处省略很多字)。对于临床工作者,通过体现病人临床特征的关键词,可以从OMIM数据库中寻找最近的临床检测标准和发展趋势。在教学研究方面,OMIM可以迅速、简单地提供给学者们关于基因和遗传病转载 2020-10-16 11:08:11 · 5592 阅读 · 11 评论 -
动手学数据分析–Task05:数据建模及模型评估
动手学数据分析–Task05:数据建模及模型评估原创 2020-08-26 20:11:04 · 313 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)--Task06:学习总结
数据挖掘实践(资金流入流出预测)–Task06:学习总结赛题解读赛题介绍:https://tianchi.aliyun.com/competition/entrance/231573/introduction数据集介绍及下载:https://tianchi.aliyun.com/competition/entrance/231573/information阅读完赛题介绍后,总结了一下这个赛题的目的就是预测未来一个月,每天余额宝总的的转入金额和转出金额。是一个回归问题。通过本次学习,系统的学习了如何原创 2020-08-25 14:36:47 · 557 阅读 · 0 评论 -
动手学数据分析–Task04:数据可视化
动手学数据分析–Task04:数据可视化导入数据text = pd.read_csv(r'result.csv')text.head()# 可视化展示泰坦尼克号数据集中男女中生存人数分布情况sex = text.groupby('Sex')['Survived'].sum()sex.plot.bar()plt.title('survived_count')plt.show()# 可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图text.groupby(['Sex','Su原创 2020-08-24 21:30:11 · 195 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)--Task05:建模预测
数据挖掘实践(资金流入流出预测)–Task05:建模预测数据挖掘实践(资金流入流出预测)–Task04:特征工程赛题解读赛题介绍:https://tianchi.aliyun.com/competition/entrance/231573/introduction数据集介绍及下载:https://tianchi.aliyun.com/competition/entrance/231573/information阅读完赛题介绍后,总结了一下这个赛题的目的就是预测未来一个月,每天余额宝总的的转入金额和原创 2020-08-23 18:35:51 · 499 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)--Task04:特征工程
数据挖掘实践(资金流入流出预测)–Task04:特征工程赛题解读赛题介绍:https://tianchi.aliyun.com/competition/entrance/231573/introduction数据集介绍及下载:https://tianchi.aliyun.com/competition/entrance/231573/information阅读完赛题介绍后,总结了一下这个赛题的目的就是预测未来一个月,每天余额宝总的的转入金额和转出金额。是一个回归问题。数据挖掘“二八原则“80%的原创 2020-08-23 18:32:57 · 488 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)--Task3时间序列模型
数据挖掘实践(资金流入流出预测)–Task2时间序列模型赛题解读赛题介绍:https://tianchi.aliyun.com/competition/entrance/231573/introduction数据集介绍及下载:https://tianchi.aliyun.com/competition/entrance/231573/information阅读完赛题介绍后,总结了一下这个赛题的目的就是预测未来一个月,每天余额宝总的的转入金额和转出金额。是一个回归问题。时间序列是指将同一统计量的数值原创 2020-08-22 20:54:29 · 489 阅读 · 0 评论 -
动手学数据分析--Task3数据重构
动手学数据分析–Task3数据重构了解数据重构的方法使用groupby做数据运算1。读入数据,查看数据前几行。2.使用concat方法:将数据train-left-up.csv和train-right-up.csv横向合并为一张表,并保存这张表为result_uplist_up = [text_left_up,text_right_up]result_up = pd.concat(list_up,axis=1)result_up.head()list_down=[text_left_dow原创 2020-08-22 20:38:24 · 199 阅读 · 0 评论 -
动手学数据分析-Task02:数据清洗及特征处理
数据分析-Task02:数据清洗及特征处理一、数据清洗数据清洗(data cleaning)是在机器学习过程中一个不可缺少的环节,其数据的清洗结果直接关系到模型效果以及最终的结论。在实际的工作中,数据清洗通常占开发过程的50%-80%左右的时间。学习自:https://blog.csdn.net/loveliuzz/article/details/78833835...原创 2020-08-21 09:11:28 · 318 阅读 · 0 评论 -
数据挖掘实践(资金流入流出预测)--Task1数据探索与分析
金融时序数据挖掘实战学习内容–Task1数据探索与分析1. 数据探索和准备步骤1.1 时间序列图通过时间变化可以得到事务的变化趋势1.2 数据分布可视化可以使用直方图、密度曲线图、箱型图、小提琴图等1.3 变量间相关性分析与独立性分析相关性分析定类变量:名义型变量;性别定序变量:不仅分类,还按某种特性排序;两值的差无意义;教育程度定距变量:可比较大小、差有意义的变量独立性分析/检验变量间无线性相关性,还可能存在非线性关联假设X为连续型变量,Y为离散型变量(有R种取值)????_0原创 2020-08-20 21:28:22 · 640 阅读 · 0 评论 -
动手学数据分析-Task1
数据分析-Task1.数据基础操作1. 数据载入及观察在数据处理中,第一步通常都需要导入数据,并进行对数据的初步预览1.导入库导入所需数据库:import numpy as np; import pandas as pd2.载入数据pd.read_csv(‘filename’), csv为文件格式,可替换为其他格式:tsv;xlsx3.逐块读取有时数据库过大,为了节约内存需要分批次读取:pd.read_csv(‘filename’, chunksize=int)4.修改column索引名称原创 2020-08-20 20:49:03 · 149 阅读 · 0 评论