自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 数据分析与挖掘学习历程5

关于python的作图函数一般的作图基本上靠matplotlib就可以满足需求,以下为常用的作图函数:这一部分有点多,直接贴图:

2019-03-24 10:39:04 139

原创 数据分析与挖掘学习历程4

Pandas中的主要统计特征函数其中sum(),mean(),var(),std()函数的使用格式均为D.xxx(),D为读取的样本corr使用格式:D.corr(method =‘Pearson’),其中样本D可为DataFrame,返回相关系数矩阵,method参数为计算方法,可使用Person系数,kendall系数和spearman系数,默认person系数。也可以以S1.co...

2019-03-23 22:53:08 103

原创 数据分析与挖掘学习历程3

异常值分析1.简单统计量分析先做描述性统计,分析离群点2.3σ原则如果数据服从正态分布,则距离平均值3之外的值出现概率为P<=0.003,为极小概率事件箱型图分析异常值通常被定义为Ql-1.5IQR或大于Qu+1.5IQR的值Ql称为下四分位数,表示全部观察值中有四分之一数据比他小Qu称为上四分位数,表示全部观察值中有四分之一数据比他大IQR称为四分位数间距,是Qu-Ql,...

2019-03-23 16:36:28 232

原创 数据分析与挖掘学习历程2

缺失值分析1.产生原因无法获取的数据有数据遗漏属性不存在2.缺失值影响丢失大量有用信息难以找寻规律会导致建模混乱缺失值分析删除直接把整行数据丢弃在不影响的情况下不处理插补数据插补数据方法:拉格朗日插补法数学推导如下此插补法python为scipy库所实现牛顿插值法数学推导如下此插值法未被scipy库所实现,而且差商似乎未在高数绿皮书中讲解...

2019-03-23 15:17:07 126

原创 数据分析与挖掘学习历程1

写在前头作为一个普通菜鸟,报了数据分析的选修课,也不知道从何做起,所以基本上不指望能写出一点什么,就只是先把《python数据分析与挖掘实战》这本书通读一遍,顺便以博客的形式来个云备份,不然到时候只找得到代码却忘了关键的东西就尴尬了。虽然很多数据挖掘的教程都会从叫写爬虫开始学,但爬虫这里还是直接略过吧,毕竟看书看到scrapy-splash的时候居然还要学Lua语言也确实让人感觉心累,中间学爬...

2019-03-23 14:42:46 149

原创 第一篇博客,尝试,不知是什么

第一篇博客,不知是什么

2019-03-23 14:33:47 74

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除