文章目录
1.机器学习基础
1.1监督学习
监督学习(supervised learning)
- 主要任务:
模型能够对任意给定的输入,对其相应的输出做一个好的预测。<给定一个输入产生一个输出>,对于每一个数据<训练集、测试集>都会有一个对应的输出值<标签、预测值> - 主要模型
监督学习的主要模型:线性回归、逻辑回归、支持向量机、k近邻、决策树、随机森林
1.2无监督学习
非监督学习(unsupervised learning)
- 主要任务:
模型数据没有标记信息,一般被认为是非监督学习 - 主要模型聚类、降维等
1.3泛化能力、过拟合、欠拟合
1.3.1泛化能力
- 泛化能力:
机器学习的目标是模型能在新的样本<未知样本5>中也能很好的试用,对于分类模型也希望在样本空间可以得到很好的分类,模型适用于新样本的能力称为泛化能力。## 可以理解为模型举一反三的能力
1.3.2泛化能力的度量
- 性能度量:衡量模型泛化能力的评价标准。对比不同模型的能力时,使用不同的性能度量会带来不同的评判结果。模型的好坏是相对的,什么样的模型是好的,不仅取决于算法,还取决于需求。
其中回归最常用的性能度量是均方误差