第一章
机器学习是研究关于“学习算法”的学问
1. 2 基本术语
(1)特征向量。空间中的每一个点对应一个向量
(2)学习。从数据中学得模型的过程
(3)测试。
(4)聚类
(5)监督学习和无监督学习
(6)泛化能力。学的模型适用于新样本的能力。
1.3 假设空间
(1)归纳于演绎
(2)搜索
1.4 归纳偏好
第二章
2.1 经验误差与过拟合
(1)误差
(2)过拟合与欠拟合。
2.2 评估方法
(1)留出法
(2)交叉检验法
(3)自助法
(4)调参与最终模型
性能度量
(1)错误率与精度
(2)查准率、查全率与F1
(3)ROC与AUC
(4)代价敏感错误率与代价曲线
比较检验
(1)假设检验
(2)交叉验证t检验
(3)McNemar检验
(4)Friedman检验与Nemenyi检验
偏差与方差