绪论
机器学习定义: 机器学习是对依据经验提升自身性能或丰富自身知识的各种算法和系统的系统性研究。
机器学习“原料”: 任务、模型及特征,模型占据中心地位。
正确特征+正确模型=完成任务
任务与学习问题的区别
任务 | 通过模型来完成 |
---|---|
学习问题(学习任务) | 通过能够产生模型的学习算法来解决 |
机器学习方法的核心: 依据经验提升性能(增添训练数据)。
预期实现目标: 在实际应用时算法具有良好的性能。不能一味追求在训练集上的表现,否则会存在过拟合(overfitting) 的危险。
对无法拟合的训练数据的处理方式: (1)舍弃数据,认为该数据是噪声。(2)尝试描述能力更强的分类器,前提条件:训练集数据量大、能确保特征的可靠性。