LSTM之父发文抨击本田奖:请尊重原创!

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

整理:公众号@AI科技评论

作者:蒋宝尚

链接:https://mp.weixin.qq.com/s/w1Sbpvw65kNf4nMYk23JxQ

本文转载自AI科技评论,作者已授权,未经许可请勿二次转载。

发明 LSTM 的大神Jürgen Schmidhuber和图灵三剑客在学术界的恩怨情仇是众所周知的事情了。

2015年的时候,在Hinton、Bengio、LeCun还未获得图灵奖之前,Jürgen就曾发文炮轰三位大神联合发表于 Nature 的综述文章“Deep Learning”。

列出了九条条理由指责三巨头没有足够尊重前人的成果,没有提及深度学习之父、没有引用远古的BP思想等一些研究成果...... 

昨日,Jürgen再发博客批评2019年的本田奖颁给Hinton,博客主题是“停止把奖项颁给错误的人”,针对Hinton获奖的六条理由,给出了六条批评意见。

1

Jürgen:Hinton啥也不是 ,我才是奠基者! 

在文章中,Jürgen首先承认了Hinton在人工神经网络和深度学习方面做出了重大贡献,但批评本田奖的颁奖词把他人的根本发明归功于Hinton。

整篇博客围绕“Hinton 白嫖了前人以及我的工作贡献,却只字未提”论点,以公开发表的论文以及新闻稿为论据,有理有据的展开了论证工作。

1、本田奖:Hinton博士让深度学习广泛应用,包括创造了反向传播方法。

Jürgen:Hinton和他同事确实对深度学习做出了某些重大贡献,例如波尔兹曼机、胶囊网络等技术,但是将反向传播归功于他完全错误。且不说1985年那篇“反向传播”文章中,Hinton只是第二作者,而在这篇文章三年之前,将此方法用于神经网络的训练的思想就由Paul Werbos提出。

另外,1965年,Ivakhnenko和Lapa提出了第一个通用的、适用于任意多层的深层多层感知器的有效学习算法。Ivakhnenko在1971年的论文已经描述了一个有8层的深度学习前馈网络,比1985年Hinton工作的要深得多.....

这些奠基性的工作,Hinton近几年一嘴都没提过。

2、本田奖:2002年,Hinton提出了限制性波尔兹曼机器(RBM)的快速学习算法,此类方法让深度学习更加强大,也导致了目前的深度学习革命。

Jürgen:Hinton的神经网络无监督的预训与当前的深度学习革命无关。而且,他的深度前馈神经网络是我1991年类似工作的翻版。

Hinton在2006年的那份工作也和我使用的被称为神经历史压缩器类似。1993年我的方法已经能够解决先前一些无法解决的“非常深度学习”任务,然后,我们用更好的,纯监督的LSTM代替了历史压缩器(history compressor)。所以说,我的实验室曾两次率先从无监督的转变监督学习,主导了2010年代初的深度学习革命。

3、本田奖:2009年,Hinton博士和他的两个学生利用多层神经网,在语音识别方面取得了重大突破,直接导致了语音识别能力的大幅提升。

Jürgen:这太扯了,最棒的端到端神经语音识别器是基于我的两个方法:1.长期短期记忆;2.连接主义时序分类算法。在2017年的时候,我们的团队就成功地将时序分类算法(CTC)训练的LSTM应用于语音。

到2015年时候,CTC-LSTM大大改善了Google的语音识别技术。几乎所有的智能手机都支持这种功能。Google的2019 年设备语音识别(2019年不再在服务器上)仍基于 LSTM。

4、本田奖:2012年,Hinton博士和另外两名学生的工作彻底改变了计算机视觉。

Jürgen:Hinton的团队成功主要归功于用于加速CNN的GPU。

2011年的时候,我在瑞士的团队就做出了基于GPU的CNN,称作DanNet的网络实际上是第一个突破,他比早期网络更加深,而且当时它就表明:深度学习的效果远远好于现有的最先进的图像识别对象。

DanNet在2011年硅谷的IJCNN大会上大放异彩的成绩就充分说明了这一点。如今IBM、西门子、谷歌和许多初创公司都在用这种方法。现代计算机视觉的大部分工作都是我2011年的延伸。

5、本田奖:Hinton发明了“dropout”。

Jürgen:“dropout”实际上是Hanson早先的随机Delta规则的一种变体。Hinton在2012年发表的论文并未引用这一点。

此外,我们已经在2011年证明,dropout对于赢得计算机视觉竞赛并获得超过人类的成绩并不是必要的 ,唯一真正重要的任务是使CNN在GPU上更深、更快。

6、本田奖:Hinton的贡献史无前例、不可或缺。 

Jürgen:我才是!当前在计算机视觉、语音识别、语言处理、手写识别、机器人技术、游戏、医疗影像等领域产出的应用,其中2~6都依赖于我们的LSTM。

2

网友评论:Schmidhuber不正确!

这篇批判文章,距离本田奖的颁发已经有半年之久,经过这么长时间的准备,Schmidhuber用近百篇参考文献证明,本田奖颁给Hinton就是个错误。

Schmidhuber认为:Hinton最引人注目的工作是推广了其他人创造的方法,而且从来没有在论文中提到来源。本田应该纠正这一点,不应该把不属于他的原创工作归结到他的身上,也不该让企业公关行为扭曲了科学事实。

此文一出迅速在reddit上面引起广泛讨论,批评支持皆有,但批评居多。大家都在说,发明人或许很重要,但是最重要的人是传播者,Hinton获得多类奖项合情合理。

Jürgen很棒,但是没有三巨头,我们不会用BP来训练神经网络。      

BP在数学上很普通,重要的是,Hinton将它引入了神经网络!

我们应该把奖颁给实际改变世界的人,而不是仅仅第一个发明或者发现事物的人!       

还有人提出疑问:那么我该在论文中引用Schmidhuber和Hinton么?

3

Schmidhuber:整个学术界都想遗忘的大神

在2019年,在图灵奖颁发给深度学习三巨头:Yoshua Bengio、Geoffrey Hinton、Yann LeCun的时候,有不少人质疑为什么奖项不颁发给Schmidhuber,若单论贡献Schmidhuber也是深度学习先驱者,他发明的LSTM对学术界和工业界的影响不亚于获图灵奖的某个人。

国内著名学者周志华认为 LSTM 是教科书级的贡献。

做为瑞士Dalle Molle人工智能研究所的联合主任,除了在1997年提出LSTM之外,他还在1992年提出的一种PM(Predictability Minimization)模型,或者或为GAN的变种。

2011年JürgenSchmidhuber还与他的博士后学生在GPU上实现CNN(卷积神经网络)的显著加速,现在这种方法已经成为计算机视觉领域的核心。

而在谷歌学术上,Schmidhuber的LSTM就已经超越反向传播,登顶20世纪AI论文高引第一名。

如此优秀的学者,在学界总是充满争议,是因为他的研究总是和其他人的研究莫名撞车,不光和图灵奖三剑客有过纠纷,还曾跟Ian Goodfellow争吵过GAN到底算谁的。

《硅谷钢铁侠》的作者在2018年5月写过一篇Jürgen Schmidhuber的特稿,题目是《这个人是AI圈想要忘记的教父》。

这篇文章提到,在大多数学术界之外,Schmidhuber仍然很不为人知。主要是因为学术圈里的同伴不喜欢他,不少同行评价他自私、狡猾,给人带来痛苦。

由于Schmidhuber频繁在学术期刊和会议上怼研究人员,打断他人演讲要求同行承认他们借用甚至窃取了他的想法,后来业内创造了一个动词”Schmidhubered“,谁被别人攻击了就可以用Schmidhubered。

LeCun也曾在一封email回复中写道:“Jürgen 对众人的认可过于痴迷,总是说自己没有得到应得的很多东西。几乎是惯性地,他总是在别人每次讲话结束时都要站起来,说刚刚提出的成果有他的功劳,大体上看,这种行为并不合理。”

4

 

奖项是否能够代表贡献?

我们顺着LeCun的回复思考,痴迷于众人的认可是否重要?或者说奖项是否能够代表贡献?这个回答从历史的角度来看似乎能够说句“是”。

学过微积分的都知道,有个基本定理称为牛顿-莱布尼茨公式,牛顿和莱布尼兹在谁是微积的创立者上,二人曾争论不休。

鉴于当时牛顿皇家学会社会地位,如果莱布尼茨不拿出命来争,恐怕这个定理会被改名为牛顿公式,那么他的贡献也会被埋没。

定理的命名何不看做是一种奖项?能够让自己的工作得到别人的认可,知道自己研究能够带给别人帮助是顶尖科学家毕生的追求。

如果奖项不本着公平、公正的态度,如果奖项的评选让资本、势力来干预,那会寒了做科研人的心。

这种资本操控技术认可的例子在科学历史上不是没有发生过,例如还是青年的特斯拉就因为资本的势力被爱迪生将27项专利转入爱迪生通用公司。

获得资本加持的爱迪生如今还在小学教科书上表现为一生拥有2000多项发明、1000多项专利,一天不申请专利就浑身难受的发明狂人。

事实上,爱迪生一生发明无数,但不少都是其公司工程师研究出来的,然后强行以他的名字申请专利。他抢先注册了不少别人的专利,从而构建了专利网络来打压对手。

而特斯拉晚年凄凉、穷困潦倒,最终死在了纽约一旅馆3327房间,并留下一大笔债务未还。

所以,强者愈强,弱者愈弱的马太效应在学界上也适用,如果在学术上能够获得非常多的奖项,那么更多的奖项也会随之而来,也会有更多的话语权。

LSTM的发明人Schmidhuber的处境或许没有莱布尼兹和特斯拉那么困顿,那种声嘶力竭要求认可,要求有更多的“奖项”,要求在论文中尊重原创者的做法非常相似。

目前Schmidhuber的心情或许可以用下面的这张图片表现,虽然两者表达的不是一个事情,但都表现出了那种绝望,“我真只吃了一碗”可以换成“这项工作真是我的”。  


推荐阅读:

吐血整理|3D视觉系统化学习路线

那些精贵的3D视觉系统学习资源总结(附书籍、网址与视频教程)

超全的3D视觉数据集汇总

大盘点|6D姿态估计算法汇总(上)

大盘点|6D姿态估计算法汇总(下)

机器人抓取汇总|涉及目标检测、分割、姿态识别、抓取点检测、路径规划

汇总|3D点云目标检测算法

汇总|3D人脸重建算法

那些年,我们一起刷过的计算机视觉比赛

总结|深度学习实现缺陷检测

深度学习在3-D环境重建中的应用

汇总|医学图像分析领域论文

大盘点|OCR算法汇总

重磅!3DCVer-论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-论文写作与投稿 微信交流群,目前已满2000+人,旨在交流顶会(ICRA/IROS/ROBIO/CVPR/ICCV/ECCV等)、顶刊(IJCV/TPAMI/TIP等)、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值