认识世界上最强大的新型开源人工智能模型:HyperWrite 的 Reflection 70B

在这里插入图片描述

城里来了一位新国王: 人工智能写作初创公司 HyperWrite 的联合创始人兼首席执行官马特-舒默(Matt Shumer)今天发布了 Reflection 70B,这是一种基于 Meta 开源 Llama 3.1-70B Instruct 的新型大型语言模型(LLM),它采用了一种新的错误自我纠正技术,并在第三方基准测试中取得了优异的性能。 正如舒默在社交网络 X 上发布的一篇文章中所说,Reflection-70B 现在似乎是 “世界上最顶级的开源人工智能模型”。

在这里插入图片描述
他在这里发布了以下图表,显示其基准性能:

在这里插入图片描述
Reflection 70B 通过了包括 MMLU 和 HumanEval 在内的多项基准测试,并使用 LMSys 的 LLM 去污器进行了严格测试,以确保测试结果不受污染。 这些基准测试表明,Reflection 的性能始终优于 Meta 的 Llama 系列模型,并可与顶级商业模型进行正面竞争。

你可以在 "游乐场 "网站上的演示中亲自体验一下,但正如 Shumer 在 X 上指出的那样,开源人工智能模型的新王者宣布后,演示网站的流量已经爆满,他的团队正在争分夺秒地寻找足够的 GPU(图形处理单元,Nvidia 和其他公司生产的用于训练和运行大多数生成式人工智能模型的贵重芯片)来满足需求。

Reflection 70B 如何与众不同

舒默强调说,Reflection 70B 不仅能与顶级模型竞争,还能带来独特的功能,特别是错误识别和纠正功能。

正如舒默在 DM 上告诉 VentureBeat 的那样:“这个想法我已经想了好几个月了。 法学硕士会产生幻觉,但他们无法纠正错误。 如果你教会 LLM 如何识别并纠正自己的错误,那会发生什么呢?”

因此,这个模型被命名为 “反思”–它可以反思自己生成的文本,并在将其作为输出结果提供给用户之前评估其准确性。

该模型的优势在于一种名为 "反思调整 "的技术,它可以在最终完成响应之前发现自己推理中的错误并加以纠正。

在这里插入图片描述
在这里插入图片描述
Reflection 70B 为推理和纠错引入了几个新的特殊标记,使用户更容易以更有条理的方式与模型进行交互。 在推理过程中,模型会在特殊标记中输出推理结果,以便在发现错误时进行实时纠正。

游戏场地演示网站包括供用户使用的建议提示,如询问 Reflection 70B 在 "草莓 "一词中有多少个字母 “r”,以及哪个数字更大(9.11 还是 9.9),这两个简单的问题是许多人工智能模型(包括领先的专有模型)都无法始终正确回答的。 我们对它的测试很慢,但 Reflection 70B 最终在 60 多秒后做出了正确的反应。

在这里插入图片描述
这使得该模型特别适用于需要高精度的任务,因为它将推理分成了不同的步骤,从而提高了精度。 该模型可通过人工智能代码库 Hugging Face 下载,API 访问将于今天晚些时候通过 GPU 服务提供商 Hyperbolic Labs 提供。

更强大、更大的型号即将推出 Reflection 70B 的发布只是 Reflection 系列的开始。

舒默宣布,下周将推出一个更大的模型–Reflection 405B。

他还告诉VentureBeat,HyperWrite正在努力将Reflection 70B模型集成到其主要的人工智能写作助手产品中。

“我们正在探索将该模型集成到HyperWrite中的多种方法–我将很快分享更多相关信息。”

Reflection 405B的性能预计将超过目前市场上最顶级的闭源模型。 舒默还表示,HyperWrite 将发布一份报告,详细介绍训练过程和基准,让人们深入了解为 Reflection 模型提供动力的创新。

Reflection 70B 的底层模型是在 Meta 的 Llama 3.1 70B Instruct 基础上构建的,使用的是现有的 Llama 聊天格式,确保了与现有工具和管道的兼容性。

huggingface: mattshumer/Reflection-Llama-3.1-70B

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值