转自:https://www.zhenxiangsimple.com/2019/03/19/tech-ml-gn/
- 数据集(data set):一组用于机器学习的数据的集合
- 示例(instance):数据集中的一条数据记录
- 特征向量(feature vector):一个示例在数学上的表示
- 训练数据(trainning data):使用机器学习用来建立模型的数据
- 样本空间(sample space):训练数据中用于作为条件的数据,即预测时的输入值
- 标记空间(label space):训练数据中用于作为结果的数据,即预测时的被预测值
- 分类(classification):被预测值的结果数据是离散数据
- 回归(regression):被预测值是连续数据
- 聚类(clustering):被预测值在训练阶段并没有被明确指定
- 训练(training):使用训练数据对机器学习算法进行训练
- 监督学习(supervised learning):训练阶段有明确的标记数据,即初始状态有为数据做好数据标记,分类和回归都属于监督学习
- 无监督学习(unsupervised learning):跟监督学习相对的概念,聚类属于无监督学习
- 泛