第一章 基础概念
样本:X
标记:Y, 二分类时取值 y = {0,1};连续性样本取值 y = R
备注:这个和我们的基因型文件与表型样本表示上相反。
泛化:
“数据决定模型效果的上限” :数据量(大)和特征工程(合理细致)
“算法则是让模型无限逼近上限” :效果好最好
假设空间:确定假设空间——机器学习算法——得到模型
版本空间:假设空间的集合
第二章 模型评估与选择
这一部分有很多公式推导,因为我主要学习如何使用,所以推导细节没有很详细的学习。这部分我学到的模型评估方法可以说MSE等。