机器学习是通过编程让计算机从数据中进行学习的科学
计算机程序利用经验 E 学习任务 T, 性能是 P, 如果针对任务 T 的性能 P 随着经验 E 不断增
长, 则称为机器学习。
使用机器学习方法挖掘大量数据, 可以发现并不显著的规律。 这称作数据挖掘。
一个典型的监督学习任务是分类。 垃圾邮件过滤器就是一个很好的例子: 用许多带有归类
( 垃圾邮件或普通邮件) 的邮件样本进行训练, 过滤器必须还能对新邮件进行分类。
另一个典型任务是预测目标数值, 例如给出一些特征( 里程数、 车龄、 品牌等等) 称作预测
值, 来预测一辆汽车的价格。 这类任务称作回归
一些回归算法也可以用来进行分类, 反之亦然。 例如, 逻辑回归通常用来进行分类,
它可以生成一个归属某一类的可能性的值( 例如, 20% 几率为垃圾邮件) 。