用python数据分析与挖掘实战
Cicome
这个作者很懒,什么都没留下…
展开
-
python数据分析和数据挖掘笔记
前三章:1,python中的常见库:2,截断均值是去掉高低极端值之后的平均数。3,众数是指数据集中出现最频繁的值。众数并不经常用来度量定性变量的中心位置,更用于定性变量。众数不具有唯一性。4,极差=最大值-最小值5,标准差: 标准差度量数据偏离均值的程度,计算公式为:6,变异系数变异系数度量标准差相对于均值的集中趋势,计算公式为:原创 2018-01-23 17:09:23 · 902 阅读 · 2 评论 -
pandas.cut函数说明
1,功能:将数据进行离散化pandas.cut(x,bins,right=True,labels=None,retbins=False,precision=3,include_lowest=False) 参数说明:x : 进行划分的一维数组 bins : 1,整数---将x划分为多少个等间距的区间 In[1]:pd.cut(np.a原创 2018-01-24 17:16:37 · 24776 阅读 · 2 评论 -
python数据分析和挖掘实战
第五章:1, 常用的分类和预测算法2, 回归分析3, 主要回归模型4, 决策树算法:tip:使用dot -Tpng data.txt -o data.png 可以将生成的树用Graphivz进行可视化。(目前会出现编码问题,还没解决)5 ,人工神经网络算法:6,分类与预测算法评价6.1 绝对误差和相对误差6原创 2018-01-25 15:18:29 · 927 阅读 · 0 评论