复旦团队开源大模型 MOSS

首先解释一下我们的MOSS版本,目前开源的版本我们称为MOSS 003,二月份公开邀请内测的版本为MOSS 002,一月份我们还有一个内部测试版本叫做OpenChat 001,这里正好简单介绍一下我们的历次迭代过程。

 

OpenChat 001

在去年ChatGPT问世后,国内NLP从业者受到冲击很大,当时没有llama也没有alpaca,大家普遍认为我们距离ChatGPT有一到两年的技术差距。而要做ChatGPT有两个部分是很昂贵的,一个是数据标注,一个是预训练算力。我们没有算力,但是可以想办法构造一些数据来试试看,毕竟AI都强大到能替代这么多人的工作了,没理由认为它替代不了标注人员的工作。于是我们当时从OpenAI的论文附录里扒了一些它们API收集到的user prompt,然后用类似Self-Instruct的思路用text-davinci-003去扩展出大约40万对话数据。没错,跟今天的alpaca类似,而且我们当时还是多轮对话而不是单轮指令。之后在16B基座(CodeGen)上做了一下fine-tune,发现似乎稍微大点的模型很容易学到指令遵循能力,下面是当时的一些示例。

OpenChat 001 指令遵循能力

OpenChat 001 多轮对话能力

OpenChat 001 跨语言对齐能力

从上面的例子可以看到,一月份的OpenChat 001就已经具备了指令遵循能力和多轮能力,而且我们还惊喜的发现它具有很强的跨语言对齐能力,它的基座预训练语料中几乎不存在中文,但是却可以理解中文并用英文回答。这在当时给了我们很大信心。

后来流浪地球2上映,加上我们发现OpenChat这个名字已经被人用过了,于是改名为MOSS。

MOSS 002

OpenChat 001不具备中文能力,不知道关于自己的信息(比如名字、能力等)&#

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_41771998

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值