阿里千问Qwen-72 b在中文测试中击败了GPT-3.5

2023.11.30 我们在 ModelScope 和 Hugging Face 上发布了Qwen-72B和Qwen-72B-Chat,它们在 3T 令牌上进行训练并支持 32k 上下文,以及Qwen-1.8B和Qwen-1.8B-Chat 。

我们还增强了 Qwen-72B-Chat 和 Qwen-1.8B-Chat 的系统提示功能,请参阅示例文档

另外,支持Ascend 910和Hygon DCU上的推理。检查ascend-support并dcu-support了解更多详细信息。

网友讨论:

  • Qwen 在所有测试中击败 GPT-4 的都是中文。虽然这对开源来说是个好消息,但 Qwen-72B 的最大性能看起来与 GPT-3.5 不相上下。
  • 到目前为止,所有这些基准都是普通话的。在英语中它仍然落后于 GPT4。尽管如此:与 175b GPT4 相比,70b LLM 有多好!
  • 为什么击败 GPT 4 如此困难且花费如此长的时间?
  • 更令人印象深刻的是,这是在制裁下通过拆解 4090 显卡下实现的。

https://www.jdon.com/70415.html

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值