机器学习--波澜壮阔四十年

SIGAI_csdn

于 2018-06-12 10:59:13 发布

阅读量1.1k

点赞数 1

文章标签：人工智能机器学习 AI 深度学习 SIGAI

本文链接：https://blog.csdn.net/SIGAI_CSDN/article/details/80662283

版权

机器学习从1980年代的成形期到2012年后的深度学习时代，经历了反向传播、SVM、AdaBoost、RNN等重要算法的发展，目前在图像识别、语音识别等领域取得了显著成就。深度学习的崛起，如AlexNet和深度循环神经网络，为复杂AI问题提供了强大解决方案。

摘要由CSDN通过智能技术生成

其它机器学习、深度学习算法的全面系统讲解可以阅读《机器学习-原理、算法与应用》，清华大学出版社，雷明著，由SIGAI公众号作者倾力打造。

什么是机器学习？

人工智能的再次兴起让机器学习（Machine Learning）这个名词进入了公众的视野，它成为当前解决很多人工智能问题的核心基石。

机器学习是什么？

如果只用一句话解释这个概念，最简单直观的答案是：机器学习用计算机程序模拟人的学习能力，从实际

例子中学习得到知识和经验。

机器学习是人工智能的一个分支，也是人工智能的一种实现方法。它从样本数据中学习得到知识和规律，然后用于实际的推断和决策。它和普通程序的一个显著区别是需要样本数据，是一种数据驱动的方法。

人的绝大部分智能是通过后天训练与学习得到的，而不是天生具有的。新生儿刚出生的时候没有视觉和听觉认知能力，在成长的过程中宝宝从外界环境不断得到信息，对大脑形成刺激，从而建立起认知的能力。要给孩子建立“苹果”、“香蕉”、“熊猫”这样的抽象概念，我们需要给他/她看很多苹果、香蕉的实例或者图片，并反复的告诉他/她这些水果的名字。

经过长期训练之后，终于在孩子的大脑中形成了“苹果”、“香蕉”这些抽象概念和知识，以后他/她就可以将这些概念运用于眼睛看到的世界。

机器学习采用了类似的思路。如果我们要让人工智能程序具有识别图像的能力，首先要收集大量的样本图像，并标明这些图像的类别（这称为样本标注，就像告诉孩子这是一个苹果），是香蕉、苹果，或者其他物体。然后送给算法进行学习（这称为训练），训练完成之后得到一个模型，这个模型是从这些样本中总结归纳得到的知识。接下来，我们就可以用这个模型来对新的图像进行识别了。这种做法代表了机器学习中一类典型的算法，称为有监督的学习。除此之外，还有无监督学习、半监督学习、强化学习等其他类型的算法。

机器学习并不是人工智能一开始就采用的方法。人工智能的发展经历了逻辑推理，知识工程，机器学习三个阶段。

第一阶段的重点是逻辑推理，例如数学定理的证明。这类方法采用符号逻辑来模拟人的智能。

第二阶段的代表是专家系统，这类方法为各个领域的问题建立专家知识库，利用这些知识来完成推理和决策。如果要让人工智能做疾病诊断，那就要把医生的诊断知识建成一个库，然后用这些知识对病人进行判断。

把知识总结出来告诉计算机程序有时候非常困难，例如要告诉计算机怎么识别图像和声音。假设我们要让程序判断下面的图像是否为猫：

判断图像是否为猫的规则该怎么描述？最笨的方法是暴力枚举，即为每张可能的图像对应一个结果（是猫，不是猫），根据这个对应规则进行判定。对于高度和宽度都为256像素的黑白图像，如果每个像素值的值是0-255之间的整数，根据高中学习的排列组合中的乘法原理，所有可能的图像数量为：

这是一个天文数字，以现在计算机的计算和存储能力是无法实现的。事实上我们自己也无法精确的为判断看到的一个物体是否为猫建立一个模型，这就是所谓的只可意会不可言传，但这不妨碍我们能识别猫。

人工知识存在的另一个问题是不具有通用性，可扩展性差。对每个具体问题都要建立起规则和知识库，实现成本非常高。还是以图像识别为例，我们即使建立了怎样判断图像是否为猫的规则，但这种规则不能判断图像是否为狗，因此我们需要为狗也建立一种规则。

授“人”以鱼不如授“人”以渔

与其总结好知识告诉人工智能，还不如让人工智能自己去学习知识。要识别猫的图像，可以采集大量的图像样本，其中一类样本图像为猫，另外的不是猫。然后把这些标明了类别的图像送入机器学习程序中进行训练。训练完成之后得到一个模型，之后就可以根据这个模型来判断图像是不是猫了。对声音识别和其他很多问题也可以用这样的方法。在这里，判断图像是否为猫的模型是机器学习程序自己建立起来的，而不是人工设定的。显然这种方法具有通用性，如果我们把训练样本换成狗的图像，就可以识别狗了。