深度学习与人工智能概念的潜在联系,我们依然借助维恩图来说明,如图4.1所示。
1、人工智能
“人工智能”这个概念新鲜时髦但又含混模糊,同时包罗万象。尽管如此,我们仍尝试对 人工智能进行定义:用一台机器处理来自其周围环境的信息,然后将这些信息分解并进行适 当决策,以达到实现某些期望结果的目的。根据定义,部分人只是将人工智能理解为“通用 智能”,因为人们关注的一般是其归纳推理和解决问题的能力。在实践中,尤其在大众媒 体那里,“人工智能”被用来描述那些尖端机器的能力。目前,这些能力包括语音识别、视频 内容解析、聊天机器人、自动驾驶、工业机器人以及在像围棋这样的“直觉密集型”棋盘游戏 中击败人类。一旦人工智能的能力被突破并且被普遍应用(例如,20世纪90年代最先进的 手写数字识别,详见第1章),“人工智能”这个名字就会被大众媒体抛弃,因为这会使人工智 能定义的标准不断被提高。
机器学习
机器学习和机器人技术一样,属于人工智能的一个方面。机器学习是计算机科学的一 个领域,关注的是如何构建软件并使得软件自动识别数据模式,而无须程序员明确指示。也 就是说,通过充分了解问题并做出一些假设,程序员就可以提供相应的模型框架和相关数 据,让软件充分学习并解决问题。如图1.12所示,机器学习通过处理原始输入,可以提取出 与数据建模算法一致的特征,这个过程因为需要人工设计,所以稍显费力。
3、表征学习
通过图4.1,我们可以更形象地剖析表征学习。这个概念是从第2章开始介绍的,简而 言之,表征学习是机器学习的一个分支,表征学习的模型构建方式是通过提供足够的数据来 自动学习特征。
这样学习到的特征相比人工设计的更加全面和准确。目前,虽然学术界和 业界的研究人员都在积极研究特征的可解释性,但是机器学习到的特征仍然很难被人理解 或被很好地解释。
4、人工神经网络
目前,人工神经网络在表征学习领域占据主导地位。正如前面所提到的,人工神经元是 受生物脑细胞启发的简单算法,因为无论是人工的还是生物的单个神经元,首先都要接收很 多其他神经元的输入,然后通过一系列计算,产出单个输出。人工神经网络是人工神经元的 集合,它们在排列后,就可以彼此之间发送和接收信息。首先将数据输入人工神经网络,然 后人工神经网络以某种方式处理数据,进而得到预测结果。例如,手写数字的图像被输入人 工神经网络,经过处理后,便可得到关于输入图像所代表数字的准确预测。
5、深度学习
在图4.1所示的概念中,深度学习是最容易定义的。我们已经多次提到,深度学习网络 是由好几层人工神经元组成的网络,图1.11和图1.17所示的经典架构在图4.2中也有简单描述。深度学习网络通常多于5层,具体结构如下。
■输入层:接收输入网络的数据。
■隐藏层:学习输入数据中的特征表示,一般有3个或更多个。一种经常使用的隐藏 层类型是密集层,在这种类型中,给定层中的所有神经元都可以从前一层中的每个 神经元接收信息(因此,“密集层”的常见同义词是全连接层)。除了这种通用的隐藏 层类型之外,还有很多其他类型专门针对特定的用途。
在深度学习网络中,若干人工神经元分层排列,每一层都是对前一层更抽象的非线性重组,所以只要有足够的数据集,即使只有几层的深度学习模型,也足以进行学习训练并解决 特定问题。也就是说,我们偶尔会看到数百层甚至上千层的深度学习网络,但它们并不经常使用。
自从2012年AlexNet在ILSVRC公开挑战赛(参见图1.15)上获胜以来,无数事实已经 证明:应用深度学习方法的建模适用于多种机器学习任务。事实上,随着深度学习推动当代 人工智能的不断进步,“深度学习”已经被大众媒体当作“人工智能”的代名词。
以上内容摘自《图解深度学习》
图解深度学习
深入浅出讲解深度学习的主流技术及背后的原理,彩色印刷,图文并茂,助你快速上手TensorFlow和PyTorch等热门工具。
本书汇集了专家乔恩·克罗恩(Jon Krohn)和格兰特·贝勒费尔德(Grant Beyleveld)的丰富经验和具体实践,以及阿格莱·巴森斯(Aglaé Bassens)的精美插图,用直观生动的方式,清晰地阐释了什么是深度学习,为什么深度学习如此流行,并梳理了深度学习与其他机器学习方法的关系。在这本书中,作者通过Jupyter notebook这一强大的工具,编写可动手操作的Python代码,为那些想要开始学习深度学习的开发人员、数据科学家、研究人员、分析师和学生创建了实用的参考教程。
为了帮助读者快速提高,作者重点讲解了利用深度学习库Keras灵活构建TensorFlow模型的方法,同时还介绍了深度学习库PyTorch的强大功能。阅读本书,读者将能够深入理解和掌握深度学习的主要方法及其在机器视觉、自然语言处理、图像生成和游戏领域的应用。
人工智能和深度学习书籍推荐
人工智能:现代方法(第4版)
系统性总结人工智能的方方面面,国际人工智能领域专家斯图尔特·罗素撰写人工智能百科书,时隔十年重磅更新,被全球全球1500多所学校采用的经典教材。
本书全面、深入地探讨了人工智能(AI)领域的理论和实践,以统一的风格将当今流行的人工智能思想和术语融合到引起广泛关注的应用中,真正做到理论和实践相结合。全书分7个部分,共28章,理论部分介绍了人工智能研究的主要理论和方法并追溯了两千多年前的相关思想,内容主要包括逻辑、概率和连续数学,感知、推理、学习和行动,公平、信任、社会公益和安全;实践部分完美地践行了“现代”理念,实际应用选择当下热度较高的微电子设备、机器人行星探测器、拥有几十亿用户的在线服务、AlphaZero、人形机器人、自动驾驶、人工智能辅助医疗等。本书适合作为高等院校人工智能相关专业本科生和研究生的教材,也可以作为相关领域专业人员的参考书。
作者简介
斯图尔特.罗素(Stuart Russell),1986年他进入加利福尼亚大学伯克利分校,任计算机科学系教授,并曾担任系主任,人类兼容人工智能中心主任,他也是史密斯–扎德(Smith-Zadeh)工程系讲席教授。1990年,他获得了美国国家科学基金会(NSF)杰出青年科学家总统奖;1995年,他成为计算机与思想奖的获奖人之一。他是美国人工智能协会(AAAI)、美国计算机协会(ACM)和美国科学促进协会的会士,牛津大学瓦德汉学院的荣誉院士和安德鲁.卡内基(Andrew Carnegie)院士。2012年到2014年,他在巴黎担任布莱斯.帕斯卡(Blaise Pascal)主席。他在人工智能领域发表了300多篇论文,涉及范围广泛。
彼得.诺维格(Peter Norvig)曾任谷歌公司的研究总监、核心网络搜索算法的负责人。他曾与他人合作共同教授了一门有16万名学生注册的在线人工智能课程,帮助开启了当下的大规模在线公开课程的大幕。他曾担任美国宇航局艾姆斯研究中心计算科学部的负责人,负责人工智能和机器人学的研究和开发。他曾任南加利福尼亚大学的教授和加利福尼亚大学伯克利分校、斯坦福大学的教师。他是美国人工智能协会和美国计算机协会的会士,以及美国艺术与科学院和加利福尼亚科学院的院士。
两位作者共同获得了2016年首届AAAI/EAAI杰出教育家奖。
动手学深度学习 PyTorch版
《动手学深度学习》全新PyTorch版本,李沐和亚马逊科学家阿斯顿·张等大咖作者强强联合之作,机器学习、深度学习领域重磅教程,交互式实战环境,配套资源丰富!
本书是《动手学深度学习》的重磅升级版本,选用经典的PyTorch深度学习框架,旨在向读者交付更为便捷的有关深度学习的交互式学习体验。
本书重新修订《动手学深度学习》的所有内容,并针对技术的发展,新增注意力机制、预训练等内容。本书包含15章,第一部分介绍深度学习的基础知识和预备知识,并由线性模型引出最简单的神经网络——多层感知机;第二部分阐述深度学习计算的关键组件、卷积神经网络、循环神经网络、注意力机制等大多数现代深度学习应用背后的基本工具;第三部分讨论深度学习中常用的优化算法和影响深度学习计算性能的重要因素,并分别列举深度学习在计算机视觉和自然语言处理中的重要应用。
作者简介:
阿斯顿.张(Aston Zhang),亚马逊资深科学家,美国伊利诺伊大学香槟分校计算机科学博士,统计学和计算机科学双硕士。他专注于机器学习和自然语言处理的研究,荣获深度学习国际顶级学术会议ICLR杰出论文奖、ACM UbiComp杰出论文奖以及ACM SenSys最佳论文奖提名。他担任过EMNLP领域主席和AAAI资深程序委员。
扎卡里.C. 立顿(Zachary C. Lipton),美国卡内基梅隆大学机器学习和运筹学助理教授,并在海因茨公共政策学院以及软件和社会系统系担任礼节性任命。他领导着近似正确机器智能(ACMI)实验室,研究涉及核心机器学习方法、其社会影响以及包括临床医学和自然语言处理在内的各种应用领域。他目前的研究重点包括处理各种因果结构下分布变化的稳健和自适应算法、超越预测为决策提供信息(包括应对已部署模型的战略响应)、医学诊断和预后预测、算法公平性和可解释性的基础。他是“Approximately Correct”博客的创始人,也是讽刺性漫画“Superheroes of Deep Learning”的合著者。
李沐(Mu Li),亚马逊资深首席科学家(Senior Principal Scientist),美国加利福尼亚大学伯克利分校、斯坦福大学客座助理教授,美国卡内基梅隆大学计算机系博士。他曾任机器学习创业公司Marianas Labs的CTO和百度深度学习研究院的主任研发架构师。他专注于机器学习系统和机器学习算法的研究。他在理论与应用、机器学习与操作系统等多个领域的顶级学术会议上发表过论文,被引用上万次。
亚历山大.J. 斯莫拉(Alexander J. Smola),亚马逊副总裁/杰出科学家,德国柏林工业大学计算机科学博士。他曾在澳大利亚国立大学、美国加利福尼亚大学伯克利分校和卡内基梅隆大学任教。他发表过超过300篇学术论文,并著有5本书,其论文及书被引用超过15万次。他的研究兴趣包括深度学习、贝叶斯非参数、核方法、统计建模和可扩展算法。