目录
1 机器学习的定义
笼统定义:
机器学习研究如何让计算机不需要明确的程序也能具备学习能力。
——Arthur Samuel,1959
偏工程化定义:
一个计算机程序在完成任务T之后,获得经验E,其表现效果为P,如果任务T的性能表现,也就是用以衡量的P,随着E的增加,可以称其为学习。
——Tom Mitchell,1997
2 有关概念
- 系统用来学习的示例,称为训练集,每个训练示例称为训练实例或者是训练样本。
- 应用机器学习技术来挖掘海量数据,可以帮助我们发现那些此前并非立见端倪的模式。这个过程称为数据挖掘。
- 机器学习中,属性是一种数据类型(如“年龄”),而特征取决于上下文,可能有多个含义,但是通常情况下,特征意味着一个属性加上其值(如“年龄=22岁”)。
- 降维的目的是在不丢失太多信息的前提下简化数据。方法之一是将多个相关特征合并为一个。例如