ICML 2024最佳论文曾被ICLR拒稿!一作已入职OpenAI

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【Mamba/多模态/扩散】交流群

添加微信号:CVer111,小助手会拉你进群!

扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!

71a776ad34f54db011ae6d2058d24d7a.png

明敏 发自 凹非寺
转载自:量子位(QbitAI)

ICML 2024最佳论文出炉,结果发现其中一篇曾被ICLR 2024拒稿?

c3ca6c70ca9e8788ed8057c0a22edc94.png

这篇论文来自斯坦福,Pika创始人之一孟晨琳(Chenlin Meng)也参与了。

它提出了一种新的离散扩散语言建模方法,通过引入分数熵损失函数,提高了离散扩散模型在语言建模任务中的性能。

实验结果和GPT-2比较,在多数任务中都完胜。

生成效果be like:

db547b7740d89d862af49f0ff0208f18.gif

5位审稿人给出的分数分别是:88665。

但还是被AC一锤定音,最终reject……

这不禁让人想起Mamba。作为Transformer架构挑战者,它开创了大模型的一个新流派。结果却被ICLR拒稿。

当时这引发不小争议,包括ICLR创始人之一LeCun都下场表示不满:

很遗憾,历届程序委员会主席慢慢把它变成了一个与传统评审流程差不多的会议。

只有一些小胜利:OpenReview平台现在被大多数ML/AI会议使用,以及论文提交后立刻就能被所有人阅读(尽管匿名)。

af53b3ddc114408003c45916f9c37ff3.png

还有人说:

如果搜索ICML 2024接收的论文,就会发现很多都被ICLR 2024拒了。

9b2caedad32d47738cc729e8b5151fef.jpeg

这回又是咋回事?

又栽在实验不完善上?

这篇论文关注了扩散模型在文本等离散数据领域表现一直不佳的问题。

团队认为,标准扩散模型依赖于分数匹配(score matching)理论,但是这一机制推广到离散数据领域后效果不佳。

为了填补这一空白,他们提出了一种新的损失函数分数熵(score entropy),并构建了分数熵扩散模型(SEDD)。

在主要语言建模任务上,SEDD在目前所有语言扩散模型中表现最佳,和同规模自回归语言模型不相上下,在零样本困惑度任务上击败GPT-2。

bfee144a257e29bbabf20d20f537685d.png

同时SEDD可生成高质量无条件样本,可以方便在计算量和生成质量之间做权衡。通过直接参数化概率比,SEDD高度可控,可以使用提示词微调而无需专门训练。

5位审稿人中,有2位都给出8分高分。

大家普遍肯定了提出的论点。一位评审觉得论文推导过程写得也很不错,实验结果非常令人信服。

879da55c7888ce7cb9136dd2f1a5e9a5.png

不过也有很多小问题被提出,比如拼写错误、忽略了对一些实验细节的解释。

a29343abbf2757e508d059d3a93aea7c.png

从记录中可以看到,作者针对评审提出的问题进行了详尽的说明和修改(有的分2条才发完)。

cbdc2c3319e8d791f4d755fea567c648.gif

有评审看到调整后的内容,也相应调整了分数。

a1dd37ee4b70c0789c0b3b7358240764.png

不过最终AC还是拒收了这篇论文。

反驳的点就主要在于实验部分不完整

所有审稿人都认为,该论文只将GPT-2作为主要基线,缺少和其他扩散模型基线。一些审稿人认为,论文提交时实验部分不完整。

尽管作者后续增加了一些实验,但是AC仍然认为不够完善,而且论文中提到此前扩散模型表现不及自回归模型的说法可能不够准确。


‍‍1dd84884289e40ce3e7923dbe9a15e5d.png
作者后续补充内容

比如SSD-LM、TESS等模型的表现都比GPT-2表现更好,但是论文中却没有和这些结果做对比。

总之,AC认为论文提出了很好的idea,但是在实验和对比上不够完善。

4a5193b171fc241cebc00ee23d5c3fc5.png

有人表示,之前Mamba被拒也是类似的原因,后面完善了论文再拿best paper也很合理。

5d30676f430ae3a4d6a93d648f7f1ce9.png

One More Thing

值得一提的是,这篇研究的作者中不光有Pika创始人之一孟晨琳。

一作最近也加入OpenAI,更近距离感受AGI了。他将在最近的ICML 2024上进一步讲解这项工作。

b53f6c57da222bc0bf475e0d542c444f.png

论文地址:
https://arxiv.org/abs/2310.16834

何恺明在MIT授课的课件PPT下载

 
 

在CVer公众号后台回复:何恺明,即可下载本课程的所有566页课件PPT!赶紧学起来!

ECCV 2024 论文和代码下载

在CVer公众号后台回复:ECCV2024,即可下载ECCV 2024论文和代码开源的论文合集

CVPR 2024 论文和代码下载

在CVer公众号后台回复:CVPR2024,即可下载CVPR 2024论文和代码开源的论文合集

Mamba、多模态和扩散模型交流群成立

 
 
扫描下方二维码,或者添加微信号:CVer111,即可添加CVer小助手微信,便可申请加入CVer-Mamba、多模态学习或者扩散模型微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要备注:研究方向+地点+学校/公司+昵称(如Mamba、多模态学习或者扩散模型+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

 
 
▲扫码或加微信号: CVer111,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集上万人!

▲扫码加入星球学习
 
 
▲点击上方卡片,关注CVer公众号
整理不易,请赞和在看
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值