![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据分析与挖掘实战
qtayu
这个作者很懒,什么都没留下…
展开
-
python数据分析与挖掘方法-第五章挖掘建模
分类与预测: 常用的分类与预测方法: 回归分析 决策树 人工神经网络 贝叶斯网络 支持向量机 常用的二分类Logistic回归的原理: import pandas as pd filename = '../data/bankloan.xls' data = pd.read_excel(filename) x = data.iloc[:,:8].as_matrix() y = data.iloc[:,8].as_matrix() from sklearn.linear_model import Log原创 2020-10-23 17:57:07 · 788 阅读 · 0 评论 -
python数据分析与挖掘实战 -第四章数据预处理
常用的离散化方法: 等宽法:将属性的值域分成具有相同宽度的区间,区间的个数由数据本身的特点决定,或者由用户指定。 等频法:将相同数量的记录放入每个区间 基于聚类分析的方法:一维聚类方法包括两个步骤,首先将连续属性的值用聚类算法进行聚类,然后再将聚类得到的簇进行处理,合并到一个簇的连续属性值并做同一标记。需要用户指定簇的个数,从而决定产生的区间数 以上三种离散方法代码实现: ...原创 2020-10-20 19:37:12 · 1028 阅读 · 0 评论 -
python数据分析与挖掘实战-第三章数据探索
在python的pandas库中,只需要读入数据,然后使用describe()函数可以查看数据的基本情况 import pandas as pd catering_sale = '../data/catering_sale.xls' data = pd.read_excel(catering_sale, index_col=u'日期') data.describe() 箱线图: import pandas as pd catering_sale = '../data/catering_sale.xls'原创 2020-10-18 15:45:00 · 518 阅读 · 1 评论