对话图灵奖得主、CNN之父Yann LeCun:我在中国看到了AI研究热潮

d9d57d93ea9cb9d887aeb6d35e5c5d7c.gif

文 | 罗景文 译 | 王启隆

责编 | 邓晓娟

出品 | 《新程序员》

f90be97da2265e372c3b2177f3c2deac.png

卷积神经网络(Convolutional Neural Networks,简称 CNN)在最近这些年的深度学习领域可谓锋芒毕露,成为计算机视觉、语音识别等众多人工智能应用底层的基石,图灵奖得主杨立昆(Yann LeCun)便是它的重要奠基者之一。被誉为“卷积神经网络之父”的杨立昆,早在1998年,人工智能发展的第二次冬春交替之际,便创造出卷积神经网络的雏型:LeNet-5,为识别支票、数字之类的人工智能应用带来了突破性的进展。

当今,以机器学习、深度学习等为基础的智能系统逐渐渗透人们的生活,杨立昆认为,人们应当了解这些技术是如何实现和发展的。因此,他决定用通俗易懂的语言来解释人工智能领域的现状与最新进展,希望在科普的同时激发年轻人对于科学和研究的兴趣,《科学之路:人,机器与未来》一书由此诞生。

但与此同时,杨立昆直言人工智能还面临很多的未知,这些未知也影响到了自动驾驶等重要应用在近期的普及。本期《新程序员》,CSDN副总裁邹欣对话“卷积神经网络之父”杨立昆,邀请他分享多年来在人工智能领域取得卓越学术成就和工程突破的经验之谈,以及对行业人才的建议和忠告。

【小提示】点击下方👇查看专访视频

e33775b321923b9e633433d6189346fb.png

“很多想法是在技术成熟之前就诞生的”

邹欣:是什么激发你写《科学之路:人,机器与未来》这本书的?你想在这本书中传达的核心思想是什么?

杨立昆:有几个原因。首先,我认为公众对学习人工智能有很大的需求,因为人工智能正在影响我们的生活,人们应该知道这些技术是如何起作用的。我试着站在高中生及大学生的角度上思考,想象他们想要了解哪些关于世界和科技世界的一切。同时,我也一直在寻找能用通俗易懂的语言解释人工智能或其他领域的最新发展的书,所以我认为这是一种需求。我看到很多年轻人对这个领域充满热情,我希望能够激励年轻人对科学和研究的兴趣。尤其是在中国,我看到了人工智能研究的热潮。每次我去中国总是有很多年轻人对这个话题非常积极和着迷。所以,需要向他们解释AI是如何运作的。

这本书不止是面向年轻人,更是向公众和任何对AI感兴趣的人的科普,他们不需要明白数学原理也可以看懂。书中第一部分是关于历史背景的,里面有一点自传,主要讲述我刚进入这个领域时如何形成自己的思想;中间部分真正解释了关于现代人工智能、深度学习、神经网络等技术。例如我们一直在使用的底层应用程序是如何运作的,这部分有点技术性;后面的部分是关于未来的,主要讲述AI和相关的应用将如何发展。

邹欣:在你研究生涯的早期,神经网络这个想法遭到很多人的质疑,也没有出现有说服力的应用。但是你仍然坚持研究,这有什么秘诀?

杨立昆:神经网络和深度学习花了很长时间才站到了台前。部分原因是当这些想法出现在20世纪80年代末90年代初时,可获得的数据集并不多、应用程序很难部署、计算机不够强大,很多缺失的技术当时还没有弄清楚,所以只能放弃了。直到2010年初,因为出现新的方法、更大的数据集,深度学习有了最好的神经网络算法,还有了更快的、带有GPU的计算机,深度学习才重新回到人们的视野。

然而在20世纪八九十年代,你必须有一个高端的UNIX工作站才能有更大的内存。但那时候没有摄像头,很难采集图像,也没有便携数码相机,只能拍照、扫描,或者购买非常昂贵的设备。所以当时几乎没有任何图像数据集,有一些字符的图像是因为有扫描仪,基本上只有手写字符图像和语音的大数据集,仅此而已。直到互联网的出现和数码相机的普及,这些数据集才开始出现。

当时我们得到的数据集大约也9000个样本,其中2000个用于测试,7000个用于训练。对我们来说,这是当时见过的最大数据集,已经能够去做训练。后来,我们还得到了一个更大的数据集,有60000个样本。这就是当时能收集到的最大的数据集了。

所以,如果你真的相信一个概念,认为一个想法很有价值,就应该努力追求它,尽管可能要等到看到成绩后,人们才会支持这个想法。所以,很多想法真的是在技术成熟之前就诞生的。

邹欣:詹姆斯·格雷(James Gray,1998年图灵奖得主,著名数据库专家)曾说过:“很多伟大的研究论文一开始都被拒绝了”,在这种情况下,他的建议只有“重新给会议或刊物投稿”。你认为除了重新提交论文,研究人员还能做什么?

杨立昆:这让我想到了一个和arXiv有关的例子。arXiv是康奈尔大学运营维护的一个非盈利的预印本数据库。业内有个惯例,为了防止自己的项目或想法在论文收录前被剽窃,大家会将预稿上传到arXiv作为预收录,上传的时间戳用于证明论文原创性,然后才会提交给会议或期刊;有时甚至不需要提交到会议或期刊,有些论文的arXiv版本就非常成功。这当中有大量的例子,其中一个例子是大约在两年半前,我的朋友在谷歌发布了一篇和预训练自然语言处理系统有关的BE

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值