       统计学习也叫统计机器学习(statistical machine learning),是概率论、统计学、信息论、计算理论、最优化理论及计算机科学等多个领域的交叉学科,并且在发展中逐步形成独自的理论体系与方法论。现在提及的机器学习往往指的是统计机器学习。

       Herbert A.Simon对“学习”的定义是:如果一个系统能够通过执行某个过程来改进它的性能,这就是学习。

       Mitchell,1997 给学习的一个形式化定义:假设用P来评估计算机程序在某一任务类T上的性能,若一个程序通过利用经验E在T中任务上获得了性能改善,则我们就说关于T和P,该程序对E进行了学习。

      1956年,在IBM公司研发了西洋跳棋程序的Arthur Samuel 发明了machine learning 一词,将其定义为“不显式编程地赋予计算机能力的研究领域”。

2. 基本假设


3. 统计学习方法


        从给定的、有限的、用于学习的训练数据集合出发,假设数据是独立同分布产生的;并且假设要学习的模型属于某个函数的集合,称为假设空间(hypothesis space);应用某个评价准则,从假设空间中选取一个最优的模型,使得它对已知训练数据及未知测试数据在给定的评价准则下有最优的预测;最优模型的选取由算法实现。这样统计学习方法就包括模型的假设空间、模型的选择准则和模型的学习算法,称为统计学习方法的三要素,简称:模型(model)、策略(strategy)、算法(algorithm)。可以更形象的称之为:


4. 基本术语

机器学习:  machine learning

模型:  model

数据集:  data set

示例: instance

样本: sample

属性: attribute

特征: feature

属性值: attribute value

属性空间: attribute space

样本空间(输入空间): sample space

特征向量: feature vector

维数(维度): dimensionality

学习: learning

训练: training

训练样本: training sample

训练集: training set

假设: hypothesis

真实(真相): ground truth

预测: prediction

标记(标签): label

样例: example

标记空间(输出空间):label space

分类: classification

回归:  regression

二分类: binary classification

正类: positive class

反类: negative class

多分类: multi-class classification

测试: testing

测试样本: testing sample

聚类: clustering

簇: cluster

有监督学习: supervised learning

无监督学习: unsupervised learning

泛化: generalization

分布: distribution

独立同分布: independent and identically distributed. i.i.d.

归纳: induction

演绎: deduction

特化: specialization

概念: concept

版本空间: version space

输入空间:input space

输出空间: output space

特征空间: feature space

决策函数: decision function

损失函数: loss function



《机器学习实战》Peter Harrington著 李锐等译

《机器学习》周志华 著

 《模式分类》Richard O.Duda 等著

