能处理30万字的大模型——“国产大模型五虎”之零一万物

前言:

在前面的四篇文章中,我们分别介绍了KimiChat,MiniMax,智谱AI以及百川智能四个国产大模型,他们都被称之为“国产大模型五虎”。今天来到了这个系列的最后一章:零一万物,至此,大模型五虎全部集齐。


在介绍零一万物之前,我们先来看一组数据

这是截止到今年2月份, 中文大模型基准SuperCLUE统计的关于“国内外大模型发展趋势”的数据,其中的数值代表了发展的水平,我们可以清晰的看到虽然GPT一直是处于领先地位,但是国内的大模型已经实现了代际赶超的奇迹,远超GPT3.5的水平,无限接近GPT4.0的能力。

由此可知,尽管国内大模型发展起步的晚,但是在发展规模和发展潜力上却有着显著的优势。同样的,今天我们介绍的大模型,也是起步虽晚,但目前已经在超长文本处理领域取得了领先的地位。

下面我们就来一探究竟,看看这最后“一虎”,到底有何能力受诸多资方的青睐

提到李开复,相信大家都不陌生吧,曾在微软,谷歌等企业任职,后来创立了创新工场,一直活跃在AI领域。

零一万物则是由他带领一众全球顶尖科技公司的专业人才创立的一家AI大模型创业公司,专注于AI 2.0平台和应用的研发。

零一万物最新发布的大模型是“Yi”系列,包括Yi-6B和Yi-34B两个版本,

Yi-34B是一个具有340亿参数的基础模型,而Yi-6B的参数规模为60亿

这两个模型都是中英双语开源大模型

Yi-34B在关键指标上胜过市场上已有的领先开源模型,包括Meta的Llama 2,并在Hugging Face英文开源社区平台和C-Eval中文评测的最新榜单中爬升到第一位,成为全球开源大模型“双料冠军”

Yi-34B拥有全球大模型中最长的200K上下文窗口,可以处理约40万字的文本(官网公布的数据,实际上属于是反向虚标了,值得表扬),相当于他可以阅读理解超1000页PPT,一次性读完两本《三体》

既然说到这了,那我们就来实测一下看看它超长文本处理的能力到底是不是浪得虚名

我节选了《平凡的世界》的其中部分文字约25万字(原文100W字),来测试一下它的阅读能力

一共问了5个问题,从最基本的阅读,再到理解 ,和发表自己的看法,零一万物都给出了比较满意的答案。

不亏是霸榜SuperCLUE-256k的唯一大模型

超长文本能力确实吊,那我们再试试它的其它能力

老规矩,放上一个数学题让它解一下看看

我向它提问:565547854121的平方是多少

这就尴尬了不是,后面给我打了无数个9

又试了一下角色扮演能力,中规中矩,跟其它几个大模型表现的水平差不多


简单总结一下,Yi-34B确实有自己的过人之处,被称之为AI独角兽确实当之无愧,但是在一些方面还是距ChatGPT有不小的差距。

最后附上一张当前最新的国内外大模型能力总排行榜单

  • 4
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
好的,我可以为你提供一些思路和建议。 首先,需要明确脸谱图、星图和南丁格尔图的含义和适用场景。 脸谱图(Facial Chart)是将多个指标进行综合评价后,将结果以人脸的形式展现出来的图表,适用于评估人物的多个方面表现。 星图(Radar Chart)是将多个指标的得分绘制在一个圆形的坐标系中,适用于比较多个对象在多个方面的表现。 南丁格尔玫瑰图(Nightingale Rose Chart)又称为切比雪夫图(Chernoff's Faces),是将多个指标的权重和得分绘制成一个玫瑰形状的图表,适用于比较多个对象在多个方面的表现,并强调不同指标的权重。 接下来,针对蜀国五虎上将的体力、武力、智力、魅力这几个方面,可以考虑如下的可视化方案: 1. 脸谱图:将五虎上将的体力、武力、智力、魅力指标的得分综合评价后,以人脸的形式展现出来。可以通过不同颜色、大小、表情等方式来突出不同指标的分值。 2. 星图:将五虎上将的体力、武力、智力、魅力指标的得分绘制在一个圆形坐标系中。每个指标对应坐标系的一个角度,得分对应该角度上的距离。可以通过不同颜色、线条粗细等方式来突出不同上将的表现。 3. 南丁格尔玫瑰图:将五虎上将的体力、武力、智力、魅力指标的得分和权重绘制成一个玫瑰形状的图表。每个指标对应一个扇形区域,扇形的大小表示权重,扇形的长度表示得分。可以通过不同颜色、线条粗细等方式来突出不同上将的表现。 以上是一些可行的方案,具体的实现需要考虑数据的来源、可视化工具的选择等因素。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值