ACL 2024最佳论文开奖！华人团队实力杀入，投稿热门方向果然有这些

最新推荐文章于 2025-03-11 15:20:12 发布

深度之眼

最新推荐文章于 2025-03-11 15:20:12 发布

阅读量1.5k

点赞数 23

分类专栏：深度学习干货人工智能干货文章标签：机器学习人工智能深度学习论文 ACL

本文链接：https://blog.csdn.net/weixin_42645636/article/details/141228429

版权

深度学习干货同时被 2 个专栏收录

681 篇文章

订阅专栏

人工智能干货

654 篇文章

订阅专栏

继CVPR、ICML后，ACL 2024 也放榜了！今年共有7篇最佳论文、1篇最佳主题论文、35篇杰出论文，另外还有时间检验奖2篇、最佳资源论文奖3篇、最佳社会影响力奖3篇。

非常值得一提的是，今年的华人学者以及团队占比显著，全华人团队破译甲骨文夺得最佳论文！

众所周知，ACL是国际顶级会议之一，在NLP领域一直排名第一，属于CCF-A类，含金量十足。今年这届顶会一共收到了5000篇左右的论文，其中940篇论文被接收，与往年相差不大。

从录用论文的关键词来看，今年的热门方向主要有大模型、多模态研究等，如果有同学想发paper，可以参考一下。

另外还有一个好消息，ACL官方宣布论文投稿取消匿名期，同时允许作者在投稿期间宣传自身工作，这下再也不怕大会投稿被占坑了，同学们冲冲冲。

为助力想要发顶会的同学，我这次整理好了ACL 2024获奖论文合集，还有热门的大模型、多模态相关录用论文合集供大家参考，足足有71篇，开源代码基本都有！

论文原文+开源代码需要的同学看文末

下面让我们来看看部分获奖论文，可参考的创新点我做了提炼，方便同学们学习。

最佳论文

Deciphering Oracle Bone Language with Diffusion Models

华中科技大学、阿德莱德大学、安阳师范学院、华南理工大学

方法：论文介绍了一种利用图像生成技术进行古代文字解读的方法，即Oracle Bone Script Decipher (OBSD)。该方法通过采用条件扩散模型生成解读线索，为古代文字解读提供了一种新的AI辅助分析方法。通过对甲骨文数据集进行广泛的实验，论文验证了OBSD的有效性，定量结果显示了OBSD的有效性。

创新点：

通过训练条件扩散模型，利用未见过的古代文字作为条件输入来生成其现代对应的图像。这种直接提供现代表示或潜在解读线索的方法，利用模型从古代文字到现代字体的演化，绕过了传统自然语言处理方法在处理古代语言时所面临的语料构建和其他挑战。
提出了一种零样本改进策略，通过训练模型来学习不同现代汉字字体之间的结构转换。这种方法简化了数据收集过程，通过利用现有的字体变体，增强了模型对字符结构的理解，并在不直接训练甲骨文到现代汉字映射的情况下改善了初始解读结果。

Semisupervised Neural Proto-Language Reconstruction

CMU、南加州大学

方法：论文提出了半监督的历史重构任务，其中模型在训练时只使用少量带有原型标签的同源词集和大量没有原型标签的同源词集，通过构建一个反射预测子网络来改进重构，并在各种策略和体系结构的实验中展示了该方法的有效性。

创新点：

提出了一种名为DPD-BiReconstructor的新型神经网络架构，用于半监督的历史重建。该架构融合了语言学家使用的比较方法，允许将重建的词汇确定性地转换回其派生词。
引入了反射预测的任务，该任务模拟从原型到其同源词集中反射的变化。通过对重建词汇的中间表示进行反射预测，模型能够改进其重建结果。反射预测的损失被传播到重建网络中，使模型能够在未标记的同源词集上进行训练。

Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model

Cohere、布朗大学等

方法：论文介绍了Aya模型，这是一个经过指令微调的大规模多语种语言模型，支持101种语言，其中超过一半是资源较少的语言。Aya模型在多项任务上超越了现有的mT0和BLOOMZ模型，并且在模型的公平性、毒性和安全性方面进行了深入研究。

创新点；

Aya模型通过指令微调（IFT）提高了在多样化任务上的执行能力，并且在多个评估基准上展示了比现有模型更优的性能，包括在未见过的辨别性任务和生成性任务上的表现。
论文提出了一种多语种安全上下文蒸馏方法，有效地减少了模型在对抗性提示下产生有害输出的风险，并通过开源数据集和模型，推动了社区对多语种模型安全性和偏见问题的深入研究和评估。