1.1 什么是机器学习
机器学习的概念可以追溯到1959年,Arthur Samuel对机器学习做出的定义是:Field of study that gives computers the ability to learn without being explicitly programmed(即让计算机在没有被显示编程的情况下,具备自我学习的能力)。
Tom M. Mitchell在操作层面给出了更直观的定义:A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E(针对某件事情,计算机会从经验中学习,并且越做越好)。
总之,机器学习是一个计算机程序,针对某个特定任务,从经验中学习,并且越做越好。
对机器学习而言,最重要的有两方面内容:数据和模型。
数据:经验最终要转换为计算机能理解的数据,这样计算机才能从经验中学习。谁掌握的数据量大、质量高,谁就占据了机器学习和人工智能领域最有利的资本。
模型:即算法,有了数据之后,需要设计一个模型,把数据作为输入来训练这个模型。经过训练的模型,最终就成了机器学习的核心,使得模型成为了能产生决策的中枢。一个经过良好训练的模型,当输入一个新事件时,会做出适当的反应,产生优质的输出。
1.2 机器学习的用途
受益于摩尔定律,随着计算机性能的提高,以及