第一章:
预测的是离散值(好、坏):分类。
连续值(0.98、0.90):回归。
预测:通过对训练集x的学习,形成到集合y的映射
聚类:根据数据的内在联系,进行按别分类。
训练数据:有标记的(聚类过的)称为无监督学习,反之(回归和分类)为监督学习
归纳学习:广义的 从样例种学习(监督与无监督)
狭义的 从训练数据种学习概念(概念学习)
归纳偏好:样本是往往是少于实际情况的,一个学习算法需要有自己的偏好(喜欢更一般的还是更特殊的)。
奥卡姆剃刀:选择相对简单的算法作为学习算法。该准则并不能保证得出的算法在任何情况下都是最优的。
NFL定理:所有学习算法的性能和随机乱猜的期望性能是一样的。(前提是,所有可能情况的出现概率相同)具体问题具体分析