[论文笔记] Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model(多语言Aya SFT模型)

Aya 模型:一个经过指令微调的开放访问多语言模型

摘要

近年来大型语言模型(LLMs)的突破主要集中在少数数据丰富的语言上。那么,如何才能将这些突破扩展到非主流语言呢?我们的工作介绍了 Aya,这是一个支持 101 种语言的多语言生成语言模型,其中超过 50% 是低资源语言。Aya 在大多数任务上优于 mT0 和 BLOOMZ,同时覆盖的语言数量是它们的两倍。我们引入了广泛的新评估套件,扩大了 99 种语言的多语言评估的最先进水平——包括判别性和生成性任务、人类评估以及涵盖留存任务和分布内性能的模拟胜率。此外,我们还对最优微调混合物的组成、数据修剪以及我们模型的毒性、偏见和安全性进行了详细研究。我们将我们的指令数据集和模型开源,地址是 https://hf.co/CohereForAI/aya-101

引言

我的语言的极限意味着我的世界的极限。 — 路德维希·维特根斯坦

机器学习中的一个基本问题是如何有效地捕捉长尾的细微差别。我们周围的世界,包括语言和有形的物体,自然充满了稀有和被低估的例子。然而,当我们将复杂的世界转化为训练我们模型的数据矩阵时,这种不平衡现象变得更加严重。数据集一直是现代机器

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

心心喵

喵喵(*^▽^*)

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值