样本:关于一个事件或一个对象的描述的记录称为一个样本或一个示例
数据集:样本的集合称为一个数据集
学习:从数据中学得模型的过程称为学习或者训练。训练过程中使用的数据称为训练数据。其中每个样本称为训练样本。训练样本组成的集合成为你训练集。
示例结果的信息称为标记。拥有标记信息的示例称为样例。所有标记的集合称为“标记空间”或“输出空间”
二。
若我们预测的是离散值,例如“好西瓜”或“坏西瓜”。此类学习任务称为“分类”
若预测的结果是连续值,则称此类的学习任务为“回归”
将聚类中的数据分为若干个组,每个组称为一“簇”。将这种方法称为聚类。
三。
根据训练集中是否拥有标记信息。学习任务可大致划分为“有监督学习”和“无监督学习”。分类学习和回归学习是前者的代表。聚类是后者的代表。
学得模型适用于新样本的能力称为“泛化”能力。具有强泛化能力的样本能很好地适用于整个样本空间。
机器学习基本概念及基础知识_1
最新推荐文章于 2022-08-06 23:37:51 发布