算法与数学之美

交流思想,分享知识,碰撞火花,有容乃大!

一篇文章讲清楚人工智能、机器学习和深度学习的区别和联系

人工智能的浪潮正在席卷全球,诸多词汇时刻萦绕在我们耳边:人工智能(Artificial Intelligence)、机器学习(Machine Learning)、深度学习(Deep Learning)。不少人对这些高频词汇的含义及其背后的关系总是似懂非懂、一知半解。

为了帮助大家更好地理解人工智能,这篇文章用最简单的语言解释了这些词汇的含义,理清它们之间的关系,希望对刚入门的同行有所帮助。

人工智能:从概念提出到走向繁荣


1956年,几个计算机科学家相聚在达特茅斯会议,提出了“人工智能”的概念,梦想着用当时刚刚出现的计算机来构造复杂的、拥有与人类智慧同样本质特性的机器。其后,人工智能就一直萦绕于人们的脑海之中,并在科研实验室中慢慢孵化。之后的几十年,人工智能一直在两极反转,或被称作人类文明耀眼未来的预言,或被当成技术疯子的狂想扔到垃圾堆里。直到2012年之前,这两种声音还在同时存在。


2012年以后,得益于数据量的上涨、运算力的提升和机器学习新算法(深度学习)的出现,人工智能开始大爆发。据领英近日发布的《全球AI领域人才报告》显示,截至2017年一季度,基于领英平台的全球AI(人工智能)领域技术人才数量超过190万,仅国内人工智能人才缺口达到500多万。

人工智能的研究领域也在不断扩大,图一展示了人工智能研究的各个分支,包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。

640?wx_fmt=png&wxfrom=5&wx_lazy=1

图一 人工智能研究分支

但目前的科研工作都集中在弱人工智能这部分,并很有希望在近期取得重大突破,电影里的人工智能多半都是在描绘强人工智能,而这部分在目前的现实世界里难以真正实现(通常将人工智能分为弱人工智能和强人工智能,前者让机器具备观察和感知的能力,可以做到一定程度的理解和推理,而强人工智能让机器获得自适应能力,解决一些之前没有遇到过的问题)。

弱人工智能有希望取得突破,是如何实现的,“智能”又从何而来呢?这主要归功于一种实现人工智能的方法——机器学习。

机器学习:一种实现人工智能的方法


机器学习最基本的做法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测。与传统的为解决特定任务、硬编码的软件程序不同,机器学习是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。


举个简单的例子,当我们浏览网上商城时,经常会出现商品推荐的信息。这是商城根据你往期的购物记录和冗长的收藏清单,识别出这其中哪些是你真正感兴趣,并且愿意购买的产品。这样的决策模型,可以帮助商城为客户提供建议并鼓励产品消费。

机器学习直接来源于早期的人工智能领域,传统的算法包括决策树、聚类、贝叶斯分类、支持向量机、EM、Adaboost等等。从学习方法上来分,机器学习算法可以分为监督学习(如分类问题)、无监督学习(如聚类问题)、半监督学习、集成学习、深度学习和强化学习。

传统的机器学习算法在指纹识别、基于Haar的人脸检测、基于HoG特征的物体检测等领域的应用基本达到了商业化的要求或者特定场景的商业化水平,但每前进一步都异常艰难,直到深度学习算法的出现。

深度学习:一种实现机器学习的技术


深度学习本来并不是一种独立的学习方法,其本身也会用到有监督和无监督的学习方法来训练深度神经网络。但由于近几年该领域发展迅猛,一些特有的学习手段相继被提出(如残差网络),因此越来越多的人将其单独看作一种学习的方法。


最初的深度学习是利用深度神经网络来解决特征表达的一种学习过程。深度神经网络本身并不是一个全新的概念,可大致理解为包含多个隐含层的神经网络结构。为了提高深层神经网络的训练效果,人们对神经元的连接方法和激活函数等方面做出相应的调整。其实有不少想法早年间也曾有过,但由于当时训练数据量不足、计算能力落后,因此最终的效果不尽如人意。

深度学习摧枯拉朽般地实现了各种任务,使得似乎所有的机器辅助功能都变为可能。无人驾驶汽车,预防性医疗保健,甚至是更好的电影推荐,都近在眼前,或者即将实现。其原因与以下因素息息相关:

首先,深度卷积神经网络需要大量数据进行训练。网络深度太浅的话,识别能力往往不如一般的浅层模型,比如SVM或者boosting;如果做得很深,就需要大量数据进行训练,否则机器学习中的过拟合将不可避免。而2006年开始,正好是互联网开始大量产生各种各样的图片数据的时候,即视觉大数据开始爆发式地增长。

其次,是运算能力。卷积神经网络对计算机的运算要求比较高,需要大量重复可并行化的计算,在当时CPU只有单核且运算能力比较低的情况下,不可能进行很深的卷积神经网络的训练。随着GPU计算能力的增长,卷积神经网络结合大数据的训练才成为可能。

最后,就是人和。卷积神经网络有一批一直在坚持的科学家(如Lecun)才没有被沉默,才没有被海量的浅层方法淹没。最后终于看到卷积神经网络占领主流的曙光。

有一点需要特别提醒的是,或许,深度学习更值得我们借鉴的是“深度”这一思想,但它是否等同于深度神经网络,学者们的意见并非一致。比如,南京大学的周志华(西瓜书作者)提出了gcForest(多粒度级联森林),在接受采访时,周志华老师认为,解决复杂问题把模型变深可能是有必要的,但是深度学习应该不只是深度神经网络,还可以有其他形式,与神经网络相比,其他形式也许有更好的性质。这段话或许会给我们深刻的警示。

三者的区别和联系


机器学习是一种实现人工智能的方法,深度学习是一种实现机器学习的技术。我们就用最简单的方法——同心圆,可视化地展现出它们三者的关系。

640?wx_fmt=jpeg

图二 三者关系示意图

当下的人工智能时代,机器学习的重要性不言而喻,为此,中科院自动化所科研一线青年教师,推出《机器学习:从理论到实践》、《深度学习:从理论到实践》两门在线直播课程。课程体系设置充分结合理论与实践,PPT以及代码均会提供给学员,并为学员搭建跟老师微信群即时交流的平台。

机器学习课程内容

1. 数学基础(PPT资料)

1.1 矩阵论、概率论、优化基础知识

2. 机器学习算法:从理论到实践(20学时)

2.1 机器学习概述

      2.1.1 机器学习方法分类

      2.1.2 基础知识介绍

2.2 KNN算法

      2.2.1 概述与理论详解

      2.2.2 K近邻应用案例及代码实现

2.1 机器学习概述

      2.1.1 机器学习方法分类

      2.1.2 基础知识介绍

2.2 KNN算法

      2.2.1 概述与理论详解

      2.2.2 K近邻应用案例及代码实现

2.3 贝叶斯分类

      2.3.1 朴素贝叶斯

      2.3.2 贝叶斯决策论

      2.3.3 NB分类算法应用案例及代码实现

2.4 回归与分类

      2.4.1 曲线拟合

      2.4.2 线性回归

      2.4.3 logistic回归

      2.4.4 相关应用案例及代码实现

2.5 支持向量机

      2.5.1 线性支持向量机

      2.5.2 非线性支持向量机

      2.5.3 核方法

      2.5.4 SVM应用案例及代码实现

2.6 聚类算法

      2.6.1 K均值聚类

      2.6.2 层次聚类

      2.6.3 聚类算法应用案例及代码实现

2.7 数据降维

      2.7.1 线性降维

      2.7.2 非线性降维

      2.7.3 降维应用案例及代码实现

2.8 EM算法

      2.8.1 EM算法基础

      2.8.2 多高斯参数估计

      2.8.3 EM应用案例及代码实现

2.9 Adaboost算法

      2.9.1 独立于算法的机器学习

      2.9.2 Adaboost算法

      2.9.3 应用案例及代码实现

2.10 隐马尔科夫模型

      2.10.1 马尔科夫

      2.10.2 隐马尔科夫模型

      2.10.3 应用案例及代码实现

深度学习课程内容

1. 数学基础(PPT资料)

1.1 贝叶斯决策理论、参数与非参数估计

1.2 回归与分类

1.3 梯度下降优化

1.4 信息熵

2. 深度学习理论(6学时)

2.1 前馈神经网络(概述、单层神经网络、多层神经网络)

2.2 卷积神经网络(基本概念、发展历程、网络特点、网络设置、网络训练以及相关应用)

2.3 反馈神经网络(Hopfield网络、玻尔兹曼机、受限玻尔兹曼机)

3. 深度网络常见模型与Keras实战(8学时)

3.1 Keras与残差网络(从LSTM到Highway网络、从Highway网络到残差网络、基于Highway网络的应用)

3.2 自动编码机AE及生成对抗网络GAN(AE的起源与变种、生成对抗网络GAN、基于GAN网络的应用)

3.3 基于Keras的行为识别(行为识别问题简介、基于深度学习的行为识别常用模型介绍、基于Keras的行为识别实践)

3.4 基于Keras的场景分割(场景分割问题简介、基于深度学习的场景分割常用模型介绍、基于Keras的场景分割实践)

4. 深度学习框架(4学时)

4.1 Caffe入门(简介、安装和配置、优点与局限性分析、深入Caffe源码、Caffe调试)

4.2 Caffe提高(基于Caffe的MINST手写识别、Caffe的Python接口、Caffe修改与添加Layer、网络训练技巧)

讲师团队


汪老师,中科院自动化所一线科研学者,副研究员,在领域顶级会议期刊 ICCV、TNNLS、TIP等发表论文20多篇;参加全国视频图像分析技术挑战赛,获得目标检测识别第二名,熟练掌握并应用深度学习Keras框架和Caffe框架。

宫老师某知名外企研究院算法工程师,中国科学院自动化研究所博士毕业生,在计算机视觉与人工智能领域具有近六年的研究经历。攻读博士学位期间主要研究方向是模式识别与图像处理,曾在模式识别领域内顶级国际期刊发表论文,参加某知名互联网公司举办的图像分割竞赛,获得第四名的成绩。目前主要负责计算机视觉与人工智能方面的算法研发工作。

邵老师现任副教授、硕士生导师,中科院自动化所博士毕业,具有两年教学授课经验。主要研究方向包括机器学习、模式识别与图像处理,作为项目负责人承担国家自然科学基金,在国际主流期刊和会议上发表论文数篇。

霍老师,一线青年学者,西安电子科技大学博士毕业,研究方向为图像处理,主持和参与多项国家自然科学基金,以第一作者在相关领域期刊以及会议上发表论文多篇。

课程价格及优惠

机器学习、深度学习课程分别限报 300人,报满为止。

机器学习课程价格为 499元,前 100 名报名者,直接优惠 100 元,仅剩 50 个名额!深度学习课程价格为 499元。

报名者均可领取 1200G 人工智能资料,资料内容包含数据集、算法文档资料和视频资料。

640?wx_fmt=png

640?wx_fmt=png


开课时间及形式

1. 机器学习课程:11月30日-12月21日每周四、六、日晚7点-9点,在线直播授课

2. 深度学习课程:10月29日-11月26日每周六、日晚7点-9点,在线直播授课;

3. 课程一年内可实时查看视频回放;

4. 课程PPT和源程序,会提前公开给学员;

5. 课前、课中和课后,微信群均可答疑。

请添加助教微信领取优惠券

640?wx_fmt=jpeg

阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭