1 监督学习
- supervised learning:have training set. given the ‘right answer’ for each example in the data
监督学习:有训练集,数据集中的每个样本都有正确的结果
1.1 回归问题
- regression problem:predict real-valued(实数值) output
回归问题:预测连续值(实数值)的结果
1.2 分类问题
- classification problem:predict discrete-valued(离散值) output
分类问题:预测离散值的结果
2 无监督学习
3 拟合
3.1 欠拟合
- underfit(欠拟合) / high bias(高偏差)
3.2 过拟合
- overfit(过拟合) / high vorionce(高方差)
- if we have too many features, the learned hypothesis may fit the training set very well(
J
(
θ
)
≈
0
J(\theta)≈0
J(θ)≈0), but fail to generalize(泛化) to new examples
过拟合:我们有非常多的特征,这使得我们的学习假设函数在训练集上能非常好的拟合,但是无法正确预测新的样本结果
4 参考
吴恩达 机器学习 coursera machine learning
黄海广 机器学习笔记