机器学习基础
1. 学习算法
- 任务
分类、输入缺失分类、回归、转录、机器翻译、结构化输出、异常检测、合成和采样、缺失值填补、去噪、密度估计或概率质量函数估计 - 经验
根据学习过程中的不同经验,机器学习算法可以大致分类为无监督(unsupervised)算法和监督(supervised)算法,不过它们之间界线通常是模糊的。
2. 容量、过拟合和欠拟合
- 这两个因素对应机器学习的两个主要挑战: 欠拟合(underfitting)和过拟合(overfitting)。欠拟合是指模型不能在训练集上获得足够低的误差。而过拟合是指训练误差和和测试误差之间的差距太大。通过调整模型的容量(capacity),我们可以控制模型是否偏向于过拟合或者欠拟合。
3. …
机器学习的一些算法在《机器学习实战中文版》和《周志华机器学习》这两本书中更为详细,若之后学习上有推理需求,之后再来补充,先偷个懒