XTREME榜单第一，多粒度对齐的多语言预训练模型VECO 2.0

PaperWeekly

于 2023-05-06 21:17:19 发布

阅读量360

点赞数

文章标签：自然语言处理机器学习人工智能深度学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/130537823

版权

VECO 2.0是阿里巴巴达摩院的多语言预训练模型，通过多粒度对比学习任务实现跨语言统一表示。它在XTREME榜单上取得第一，解决了先前模型在语义对齐和同义词利用上的不足，涵盖109种语言，规模扩展到xlarge。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

引言

预训练语言模型在各种 NLP 下游任务中发挥着重要作用，目前语言模型已经逐渐从单语扩展到多语言，并且已经证明了其在跨语言 NLP 任务上的优越性能。

目前多语言预训练模型的训练数据主要有两种，一种是每种语言的单语数据，另一种是互为翻译的双语平行数据。为了在同一语义空间构建不同语言的表示，之前的工作主要集中在两个预训练任务上：Multilingual Masked Language Model（MMLM）和 Translation Language Model（TLM），分别对应单语和双语数据的预训练任务。

MMLM 是 Masked Language Model（MLM）的多语言版本，在共享语义空间中对每种语言分别建模；TLM 则对拼接后的双语语料进行 MLM 任务，通过 self-attention 机制隐式地捕捉双语语料之

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。