数据挖掘
Edward_is_1ncredible
这个作者很懒,什么都没留下…
展开
-
[Python数据分析] 7-模型评估
# I.理论部分# 1.模型评估 # 分类模型评估 # 回归模型评估 # 聚类模型评估 # 关联模型评估# I-1.分类模型评估# 1.二分类(正类与负类)# 概念:混淆矩阵 # TP(True Positive):实际为正,预测为正 # FN(False Negative):实际为正,预测为负(漏) # FP(False Positive):实际为负,预测为正(错) ...原创 2018-09-16 14:44:32 · 599 阅读 · 0 评论 -
[Python数据分析] 5-挖掘建模(监督学习)
# I.理论部分:机器学习是过程,模型是这个过程的结果# 1)机器学习和建模# i.学习:通过接收到的数据,归纳提取相同与不同# ii.机器学习:让计算机以数据为基础,进行归纳和总结# iii.模型:数据解释现象的系统# 2)数据集:通常来说各部分占比:训练集6:验证集2:测试集2# i.训练集:训练拟合模型# ii.验证集:通过训练集训练出多个模型后,使用验证集数据纠正或比较预测...原创 2018-08-29 22:56:20 · 814 阅读 · 0 评论 -
[Python数据分析] 4-预处理理论
I.理论部分数据和特征决定了机器学习的上线,而模型和算法只是逼近这个上限而已1)特征工程i.特征使用:数据选择,数据可用性ii.特征获取:特征来源,特征存储iii.特征处理:数据清洗,特征预处理 1.数据清洗:抽样,异常值处理 2.特征预处理:特征选择,特征变换,特征降维,特征延伸iv.特征监控:现有特征,新特征II.编码实现# 1)特征预处理:# 概念:标注(标记,...原创 2018-08-25 15:35:24 · 590 阅读 · 0 评论 -
[Python数据分析] 6-挖掘建模(无监督学习)
# III.无监督学习编码实现(聚类和关联)# 1.数据集的设定import numpy as npimport matplotlib.pyplot as pltimport scipy.stats as ss# 引入sklearn包中的datasets接口模拟一些点from sklearn.datasets import make_circles,make_moons,make_b...原创 2018-09-05 17:42:15 · 453 阅读 · 0 评论