数据挖掘 第1章
(整体介绍,比较宽泛)
1.1.1 整装待发
DRIP:Data Rich, Information Poor
1.2.1 学而不思则罔
-
学习参考资料
-
数据挖掘体系
-
数据挖掘涉及领域
1.3.1 知行合一
-
数据
-
大数据
(1) 三个特点(3V):high-volume(数据量大),high-velocity(产生速度快),high-variety(种类多)
1.4.1 从数据到知识
-
数据下载
-
数据挖掘
-
从数据到智能
-
数据挖掘的过程
1.5.1 分类问题
-
数据挖掘技术——分类
-
过拟合(绿色分界)
-
训练集与测试集
-
混淆矩阵
-
ROC曲线
-
Lift Analysis——评估模型有效性
1.6.1 聚类及其他数据挖掘问题
-
数据挖掘技术——聚类
-
数据挖掘技术——关联规则
-
数据挖掘技术——回归
-
数据可视化软件
-
数据预处理(防止G.I.G.O)
1.7.1 隐私保护与并行计算
-
隐私保护
-
云计算
-
并行计算
-
数据挖掘 = 数据 + 模型 + 高性能的设备
1.8.1 迷雾重重
看问题一定要全面,多层次!!!
(视频)
1.9.1 视频来源:互联网
(视频)
(持续更新中…)