Contrastive Preference Optimization Pushing the Boundaries of LLM Performance in Machine Translation

最新推荐文章于 2024-07-12 23:11:20 发布

UnknownBody

最新推荐文章于 2024-07-12 23:11:20 发布

阅读量359

点赞数 7

文章标签：机器翻译人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/135937238

版权

LLM 日更专栏收录该内容

515 篇文章 3 订阅

已下架不支持订阅

本文是LLM系列文章，针对《Contrastive Preference Optimization: Pushing the Boundaries of LLM
Performance in Machine Translation》的翻译。

对比偏好优化：突破机器翻译LLM性能的边界

摘要
1 引言
2 镀金还是镀金？审查黄金参考质量
3 对比偏好优化
4 实验
5 分析
6 结论

摘要

中等大小的大型语言模型（LLM）——那些具有7B或13B参数的模型——表现出有希望的机器翻译（MT）性能。然而，即使是性能最好的基于13B LLM的翻译模型，如ALMA，也与现有技术的传统编码器-解码器翻译模型或更大规模LLM（如GPT4）的性能不匹配。在这项研究中，我们弥合了这一性能差距。我们首先评估了在MT任务中监督微调LLM的缺点，强调了参考数据中存在的质量问题，尽管这是人为产生的。然后，与模仿参考翻译的监督微调相比，我们引入了对比偏好优化（CPO），这是一种训练模型以避免生成足够但不完美的翻译的新方法。将CPO应用于只有22K个平行句子和0.1%参数的ALMA模型会产生显著的改进。由此产生的模型被称为ALMA-R，可以在WMT’21、WMT’22和WMT’23测试数据集上与WMT竞赛获胜者和GPT-4的性能相匹配或超过。

1 引言

2 镀金还是镀金？审查黄金参考质量

3 对比偏好优化

4 实验

5 分析

6 结论

在这项研究中，我们最初提出了机器翻译任务中黄金参考文献的潜在质量问题，强调了高级翻译模型优于这些参考文献的例子。这一发现挑战了黄金参考作为最佳标

了解本专栏

关注

7
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
0
评论
Contrastive Preference Optimization Pushing the Boundaries of LLM Performance in Machine Translation

中等大小的大型语言模型（LLM）——那些具有7B或13B参数的模型——表现出有希望的机器翻译（MT）性能。然而，即使是性能最好的基于13B LLM的翻译模型，如ALMA，也与现有技术的传统编码器-解码器翻译模型或更大规模LLM（如GPT4）的性能不匹配。在这项研究中，我们弥合了这一性能差距。我们首先评估了在MT任务中监督微调LLM的缺点，强调了参考数据中存在的质量问题，尽管这是人为产生的。
复制链接

扫一扫

专栏目录

已下架不支持订阅

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。