数据分析与挖掘实战
文章平均质量分 66
数据分析与挖掘实战的代码笔记(Python3)
wnma3mz
知识星球(免费):
我正在「WNMA的碎碎念」和朋友们讨论有趣的话题,你⼀起来吧?
https://t.zsxq.com/7UV3Vfq
展开
-
Day Nine——白噪声检测及确定p、d、q值和模型的检验
Day Nine——白噪声检测及确定p、d、q值和模型的检验完整代码及数据地址第一部分数据discdata.xls第二部分数据discdata_processed.xls第三部分数据discdata_processed.xls第四部分数据discdata_processed.xls第五部分数据discdata_processed.xls第六部分数据predictdata...原创 2018-04-09 23:22:49 · 10054 阅读 · 1 评论 -
Day Eight——时间序列的数据处理,进行简单的数据分析
Day Eight——时间序列的数据处理,进行简单的数据分析完整代码及数据地址第一部分数据water_heater.xls第二部分数据water_heater.xls第三部分数据train_neural_network_data.xls、test_neural_network_data.xls第四部分数据water_heater.xls第一部分——筛选有效数据对应函...原创 2018-04-08 21:09:00 · 365 阅读 · 0 评论 -
Day Seven——使用SVM训练数据
Day Seven——使用SVM训练数据完整代码及数据地址第一部分数据`moment.csv“第一部分——使用SVM训练数据对应函数programmer_1步骤:读取数据, 转换矩阵data.as_matrix(), 打乱数据shuffle(data), 抽取数据集(8:2)。from numpy.random import shuffle转换训练数据和验证数据的格式。...原创 2018-03-04 00:27:45 · 973 阅读 · 0 评论 -
Day Six——使用pandas寻找关联规则
Day Six——使用pandas寻找关联规则完整代码及数据地址第一部分数据data.xls第二部分数据apriori.txt第一部分——使用Kmean聚类数据对应函数programmer_1步骤:读取数据,对类别进行字符化,转换为’A’,’B’,’C’……使用Kmeans进行离散化,这里聚类前要将数据离散化as_matrix()得到聚类中心、进行分类统计,最...原创 2018-03-03 10:02:42 · 963 阅读 · 0 评论 -
Day Five——pandas操作excel
Day Five——pandas操作excel完整代码及数据地址第一部分数据air_data.csv第二部分数据air_data.csv第三部分数据zscoredata.xls第四部分数据zscoredata.xls第一部分——使用describe观察数据对应函数programmer_1步骤:读取数据文件,指定编码格式encoding='utf-8'对数据的...原创 2018-03-02 10:17:54 · 756 阅读 · 0 评论 -
Day Four——分别使用Keras和Sklearn训练模型预测结果
Day Four——分别使用Keras和Sklearn训练模型预测结果完整代码及数据地址第一部分数据missing_data.xls第二部分数据model.xls第三部分数据model.xls第一部分——使用拉格朗日方法填充缺失值对应函数programmer_1步骤:读取数据取出缺失值前后五个数据的值,再利用from scipy.interpolate im...原创 2018-03-01 10:18:44 · 1903 阅读 · 0 评论 -
Day Three——使用sklearn和Keras训练模型可视化
Day Three——使用sklearn和Keras训练模型可视化完整代码及数据地址第一部分数据bankloan.xls第二部分数据sales_data.xls第三部分数据sales_data.xls第四部分数据consumption_data.xls第五部分数据consumption_data.xls第六部分数据arima_data.xls第七部分数据consum...原创 2018-02-28 10:49:49 · 4075 阅读 · 1 评论 -
Day Two——填充缺失值、归一化数据、PCA降维分析
Day Two——填充缺失值、归一化数据、PCA降维分析完整代码及数据地址第一部分数据catering_sale.xls第二部分数据normalization_data.xls第三部分数据discretization_data.xls第四部分数据electricity_data.xls第五部分数据leleccum.mat第六部分数据principal_component...原创 2018-02-27 00:15:34 · 2638 阅读 · 0 评论 -
Day One——利用pandas可视化处理数据
Day One——利用pandas可视化处理数据完整代码及数据地址第一、二部分数据catering_sale.xls第三部分数据catering_dish_profit.xls第四部分数据catering_sale_all.xls第一部分——可视化数据,箱线图。对应函数programmer_1数据有两列,日期和销量。先通过可视化的手段将其展示。这里使用箱线图进行展示。关于箱线图的定义,请查阅百度百科原创 2018-02-26 10:28:46 · 866 阅读 · 0 评论