CH1. Introduction --(1)


寻找数据中的模式是一个基本的问题,而且有一个很长的历史。例如16世纪Tycho Brahe(一个牛逼的天文学家)的大量的天文观测证实了Johannes Kepler的行星运行定律,这个定律为经典力学的发展提供了一个跳板。类似的,20世纪初原子光谱规律的发现在量子力学的发展和验证中扮演者重要的角色。 模式识别领域关注于利用计算机算法发现数据的规律以及利用这些规律对数据进行处理,比如对数据分类。

对于手写数字识别的例子。每个数字是一幅28x28像素的图像,可以表示为一个由784个实数组成的向量。目的是为了建立一种机制,能够将向量 x 作为输入,识别的结果0, ..., 9作为输出。这不是一个简单的问题,因为手写数字有很多个变量。



This is a nontrivial problem due to the wide variability of handwriting.(因为手写数字有不同的形状)。

It could be tackled using handcrafted rules or heuristics for distinguishing the digits based on the shapes of the strokes,(这个问题可以通过人工规则或者启发式,基于笔画的形状区别数字)。but in practice such an approach leads to a proliferation of rules and of exceptions to the rules and so on, and invariably gives poor results.


  Far better results can be obtained by adopting a machine learning approach in which a large set of N digits {x1,...,xN} called a training set is used to tune the parameters of an adaptive model.The categories of the digits in the training set are known in advance(采用机器学习方法可以获得更好的结果,用N个数字的数据集作为训练集用于自适应模型的参数调整,数字在训练集中的分类是预先知道的)typically by inspecting them individually and hand-labelling them(通常通过逐个对他们进行检查,手工标注方法获得). 

We can express the category of a digit using target vector t(用目标向量t 表示数字的类别).   which represents the identity of the corresponding digit. 用相应的数字表示样本的身份(类别)。

Suitable techniques for representing categories in terms of vectors will be discussed later. Note that there is one such target vector t for each digit image x. 适当方法在后面讨论,注意:每个t表示一个数字。


机器学习算法运行的结果可以表示成一个函数y(x).取一个新的数字样本x作为输入,生成一个输出向量y ,编码方式与t相同y(x)的准确形式在在训练阶段(training phase)定义 ,学习阶段则在训练数据的基础上进行。 一旦模型被训练,它就可以用来确定新的数字图像的identify(身份,类别)。新的数据也就是我们常说的测试集(test set )。 正确分类新样本(differ from training data)能力叫做泛化(generalization)。在实际的应用中,由于输入数据具有可变性,而训练数据只是所有可能的输入向量的一部分,因此,泛化能力是模式识别的核心目标

在大多数的实际应用中,通常的预处理(typically preprocessed)希望将原始输入变量转换到模式识别问题易于解决的变量空间中(new space of variables)。例如,在数字识别的问题中(digit recognition),数字图像通常经过平移和尺度变换(translated and scale) 使得每个数字大大小相同(contained with a box of fixed size)。这样就大大降低了同类数字的可变性(variability),因为所有数字的位置和尺度都相同,这使得随后(subsequent)用模式识别算法区分不同类别的数字变得更加容易。这个预处理的阶段有时又叫做特征提取(feature extraction)。注意:新的训练数据必须经过与训练数据相同步骤的预处理。

    执行预处理也会提高计算的速度。例如,如果你的目的是在高分辨率视屏流下的人脸检测(real-time face detection in a high-resolution video stream), 计算机必须每秒处理(handle)大量的像素点, 直接使用一个复杂的模式识别算法是不可行的。相反的, 目标是寻找有效的特征(useful features)使得计算更快,还能保存有识别度的信息(useful discriminatory information)使得脸可以从非脸的视频中区分出来。然后将这些特征作为输入,输入到模式识别算法中。例如,图像强度(image intensity)在一个矩形区域(rectangular subregion)上的均值可以被有效准确的评估(Viola and Jones, 2004), 这样一组特征在快速人脸检测中非常有效。 这个特征在数量上要小于像素特种,这种形式的预处理也是降维的一种形式(a form of dimensionality reduction)。注意:预处理过程中通常会丢弃一些信息,如果被丢弃的信息对于问题的解决很重要,整个系统整体精确度(overall accuarcy of system)会受到影响。

训练数据由输入向量以及其对应的已知的目标向量组成的应用叫做监督学习(supervised learning)问题。 就像手写数字的例子中,我们的目标是将每个数据分配到离散的有限类别中,叫做分类问题(Applications in which the training data comprises examples of the input vectorsalong with their corresponding target vectors are known as supervised learning problems. Cases such as the digit recognition example, in which the aim is to assign each input vector to one of a finite number of discrete categories, are called classification problems.)。

如果希望输出有一个或多个连续变量组成,则这个任务称作回归(regression)。 回归问题的一个例子是在输入反应物的浓度(concentrations of reactions),温度,压力时,预测化学生产过程中的产出(the yield in a chemical manufacturing process)。

在模式识别问题中,训练数据有一组输入向量x,但是没有任何对应的目标值,像这样的无监督学习问题的目标是发现数据中相似样本点组成的组, 也叫簇(clustering)。或者确定数据在输入空间中的分布(the distribution of data within the input space),即密度估计(density estimation), 或者 ,将数据从高维空间映射到两维或三维的空间中用于可视化(visualization)。

最后,强化学习(reinforcement learning (Sutton and Barto, 1998))关心的问题是finding suitable actions to take in a given situation in order to maximize a reward。 与监督学习方法不同,这里的学习算法没有给定优化输出的例子,但是必须通过一个试错的过程(a  process of trial and error)发现它们。通常算法中的一系列状态和动作(a sequence of states and action)与它的环境相互影响。很多情况下,当前的行为(current  action )不仅影响最直接的奖励(immediate reward), 而且对后续所有时间步(all subsequent time steps)长的奖励都有影响。 例如,利用适当的强化学习技术,一个神经网络能够学习成双陆棋(backgammon)高手(Tesauro, 1994)。这个网络必须学习采用一个棋盘位置(board position)作为输入,根据扔骰子的结果(a result of dice throw), 产生一个最好的移动(strong move)作为输出。This is done by having the network play against a copy of itself for perhaps a
million games. 一个主要的挑战是双陆棋可以包含许多个位置变动 。然而只有游戏结束的时候,胜利的一方获得奖励。奖励必须适当地归于所有的移动,虽然有些移动会一直好而另一些则不会。 这是一个置信度(credit assignment )的问题。 强化学习的一般特征(general feature) 是多次试探索之间的权衡(the trade-off between exploration), 这个系统尝试输出一个新的动作看看他多有效,挖掘(exploitation) ,这个系统利用这些已知的动作产生一个高的奖励。 过多的关注exploration 或者 exploitation 都会产生不良的效果。强化学习仍然是机器学习研究的一个活跃的领域。 本身没有详细介绍。

虽然每个任务都有他们自己的工具和技术, 但是很多支持它们的核心思想是相同的。



  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值