YAYI 2: Multilingual Open-Source Large Language Models

最新推荐文章于 2024-09-30 21:48:12 发布

UnknownBody

最新推荐文章于 2024-09-30 21:48:12 发布

阅读量409

点赞数 6

文章标签：语言模型人工智能自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/135699775

版权

LLM 日更专栏收录该内容

516 篇文章 3 订阅

已下架不支持订阅

本文介绍YAYI 2，一个300亿参数的多语言开放源代码大型语言模型。在预训练、对齐和推理方面进行了详细阐述，旨在提升中文环境下的性能。YAYI 2通过指令调优和RLHF与人类价值观保持一致，表现出色于多个基准测试，如MMLU和CMMLU，但在安全性方面仍需谨慎使用。

摘要由CSDN通过智能技术生成

本文是LLM系列文章，针对《YAYI 2: Multilingual Open-Source Large Language Models》的翻译。

YAYI 2：多语言开源大型语言模型

摘要
1 引言
2 预训练
3 对齐
4 推理
5 安全
6 评估
7 结论

摘要

随着自然语言处理的最新进展，大型语言模型（LLM）已经在许多现实世界任务中实现了人类层面的语言理解和生成能力，甚至被视为通用人工智能的潜在途径。为了更好地促进LLM的研究，最近提出了许多开源LLM，如Llama 2和Falcon，并获得了与专有模型相当的性能。然而，这些模型主要是为英语场景设计的，在汉语环境中表现不佳。在这份技术报告中，我们提出了YAYI 2，包括基础模型和聊天模型，参数为300亿。YAYI 2是在多语言语料库上从头开始进行预训练的，该语料库包含2.65万亿个由我们的预训练数据处理管道过滤的token。通过对数百万条指令的监督微调和从人类反馈中的强化学习，基本模型与人类价值观保持一致。在MMLU和CMMLU等多个基准测试上进行的大量实验一致表明，所提出的YAYI 2优于其他类似规模的开源模型。

1 引言

2 预训练

3 对齐

4 推理

5 安全

6 评估

了解本专栏

关注

6
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

已下架不支持订阅

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。