第1章 绪论—基本术语
(1)记录、示例、样本。
每条记录是关于一个事件或对象的描述,例如对西瓜的描述中的一条记录:(色泽=青绿;根蒂=蜷缩;敲声=沉闷),称为一个示例或者样本,一组记录的集合,称为数据集。记录和样本反映事件或对象在某方面的表现或性质的事项。
(2)分类、回归
若我们预测的是离散值,此类学习任务称为分类任务,若我们预测的是连续值,则此类学习任务称为回归任务。
(3)监督学习、无监督学习
根据训练数据是否拥有标记信息,学习任务可大致分为两大类:监督学习和无监督学习,其中分类和回归是监督学习的代表,聚类是无监督学习的代表。