转载于 机器之心
参与:思源、张倩
ICML 2019(国际机器学习)大会将于6月9日至15日在美国加州举办。大会共收到3424篇论文投稿,其中774篇被接收(接收率为22.6%)。近日,博世的分析人员根据接收论文列表做出了一份可视化图表,从中可以看出各机构和作者的论文贡献情况。
接收论文列表:https://icml.cc/Conferences/2019/AcceptedPapersInitial
排名前50的论文贡献机构
下图显示了ICML 2019接收论文贡献排名前50的机构。排名以机构贡献的论文总数为准,至少有一名作者隶属于该机构,因此一篇论文可能出现在多个机构中。红色和绿色分别表示每个机构的一作论文和最后作者论文数量。
从属于同一个机构的作者已自动合并。如Google Inc.、Google AI、Google UK都归为Google。
ICML 2019接收论文贡献数排名前50的机构(学界机构和业界机构)
由上图可以看出,在排名前十的机构中,学界和业界机构几乎平分秋色,但谷歌的论文贡献量遥遥领先于第二名MIT,被接收论文数达到了80余篇
如果将业界和学术界分开来看,我们可以得到另外两张图。
ICML 2019接收论文贡献数排名前50的学界机构。
上图显示,在众多高校和科研院所中,MIT的论文贡献量最大,达到40余篇,其次是加州大学伯克利分校和斯坦福。国内上榜的院校包括清华大学、北京大学、南京大学、香港中文大学。
ICML 2019接收论文贡献数排名前50的业界机构。
上图显示,谷歌、微软、Facebook等机构在本届ICML大会中表现最为强势。国内上榜的机构包括腾讯、阿里巴巴、华为、百度等。
尽管谷歌、微软、IBM等业界巨头贡献了很大一部分论文,但ICML 2019仍然是一场学术会议。统计后可以发现:
纯学术研究论文有452篇(58.4%);
仅有60篇论文纯粹是由业界研究机构完成的;
既包含业界也包含学界作者的论文有262篇(33.9%)。
计算相对贡献(即每篇论文的业界/学界附属机构数量除以总附属机构数量)也可以得到类似的数字。总结学界和业界对所有论文的相对贡献可以得到:
学界机构的贡献占77%;
业界机构的贡献占23%。
ICML 2019大神作者
那么哪些作者发ICML 2019大会Paper最多呢?果然,UC Berkley的机器学习泰斗Michael Jordan获得了第一。其中Jordan署名最多的还是最后一位,因此作为一位成功的「老板」,Jordan也是桃李满天下了,北大张志华、斯坦福吴恩达教授、Petuum 创始人邢波等大牛都出自其门下。
下图展示了ICML 2019论文总数排名前100的大神作者,统计会区分独立作者、一作和最后作者等。Michael Jordan因为有7篇ICML 2019接收论文而位列第一,EPFL的Volkan Cevher和UC Berkley的Sergey Levine紧随其后,他们每人都有6篇接收论文。
国内也有很多研究者取得了很好的成果,例如清华大学的朱军、微软亚研的刘铁岩、清华大学龙明盛等研究者都在ICML 2019发表了4篇论文。
令人印象深刻的是,很多研究者拥有两篇或两篇以上的一作(或单个作者)论文。例如谷歌的Ashok Cutkosky的三篇研究分别为独立作者、一作和一般作者,而CMU的Simon Du更是有3篇一作。下图展示了作为一作或独立作者的大神们:
因为最后的作者基本上都是「老板」,所以根据最后作者进行排序可以看出来该领域的一些资深研究者。他们一般都在非常优秀的实验室或研究团队,因此能做出更多的研究成果。
ICML 2019论文贡献哪家强
最后,我们可以按照相对共享对这些顶级科研机构排序,即一篇论文中到底有多少作者是该研究机构的。具体而言,项目作者用署名该机构的作者数除以总的作者数,从而计算该机构的相对贡献。
从下图可以看出来,谷歌、斯坦福、UC Berkley等都名列前茅,而清华、北大和南大也都榜上有名。
最后,作者表示,清理网站数据,尤其是附属机构的一些数据是一个冗长的手动过程。因为中间会有很多不同的、不明确的机构表示方法,也会有很多缩写表示方法,所以只能手动完成。项目作者已经尽可能合并从属关系的机构,但是中间还是可能有一些误差,因此单篇论文有可能没有统计到研究机构。
所以,如果读者发现中间的统计信息有什么误差,欢迎在下面留言指出。
参考链接:https://www.reddit.com/r/MachineLearning/comments/bn82ze/n_icml_2019_accepted_paper_stats/
您还可以在以下平台找到我们
你点的每个在看,我都认真当成了喜欢