本文为阅读总结个人认为书里概念性的、对本人有帮助的内容,仅供参考。
机器学习可以概括为:使用正确的特征来构建正确的模型,已完成既定的任务。
特征定义了一种用于描述问题域中相关对象的“语言”。一旦获得对问题域中对象的某种恰当的特征表示,我们往往便不必再去关注这些对象本身。这也正是也正对机器学习如此重要的原因。
任务是对我们所期望解决的、与问题域对象有关的问题的一种抽象表示。
许多任务都可抽象为一个从数据点到输出的映射,而这种映射或模型本身又是应用于训练数据的某个机器学习算法的输出。
模型赋予了机器学习领域以多样性,而特征和任务则为其带来了某种程度的一致性。
与所以其他机器学习模型一样,模式(pattern)也是对数据潜在结构的一种表征。
当隐变量的个数远小于原始矩阵的行数和列数时,用于发现隐变量的方法才会真正发挥作用。
依赖于有标注数据的是有监督学习,无须借助数据标注信息的是无监督学习;模型的输出包含有目标变量的是预测性模型,模型的输出不包含目标变量的是描述性模型。
预测性模型 | 描述性模型 | |
有监督学习 | 分类、回归 | 子群发现 |
无监督学习 | 预测性聚类 | 描述性聚类、关联规则发现 |
无论面对何种机器学习任务,我们都应铭记&#x