<学习笔记>
一.机器学习概念
-
致力于研究如何通过计算的手段,利用经验(历史数据)来改善系统自身的性能。
-
从数据中产生模型算法,即“学习算法”。
-
个人总结:机器学习是指机器通过历史数据训练得到模型将其应用于测试集得到输出结果
二.基本术语
- 学习(训练):从数据中学得模型的过程
- 训练集:参与模型训练的样本集合
- 测试:学得模型后,使用其样本进行预测的过程
- 测试集:被预测的样本集合
- 假设:学得模型对应的关于数据的某种潜在规律
- 分类:输出结果是离散值
- 回归:输出结果是连续值
- 监督学习:训练样本有标记
- 无监督学习:训练样本无标记
- 泛化能力:学得模型适用于新样本的能力
- 独立同分布:样本空间的全体样本都服从一个未知的分布,且相互独立