认识世界上最强大的新型开源人工智能模型：HyperWrite 的 Reflection 70B

最新推荐文章于 2024-09-10 15:09:02 发布

吴脑的键客

最新推荐文章于 2024-09-10 15:09:02 发布

阅读量1k

点赞数 17

分类专栏：人工智能文章标签：人工智能

本文链接：https://blog.csdn.net/weixin_41446370/article/details/141970229

版权

人工智能专栏收录该内容

592 篇文章

订阅专栏

在这里插入图片描述

城里来了一位新国王：人工智能写作初创公司 HyperWrite 的联合创始人兼首席执行官马特-舒默（Matt Shumer）今天发布了 Reflection 70B，这是一种基于 Meta 开源 Llama 3.1-70B Instruct 的新型大型语言模型（LLM），它采用了一种新的错误自我纠正技术，并在第三方基准测试中取得了优异的性能。正如舒默在社交网络 X 上发布的一篇文章中所说，Reflection-70B 现在似乎是 “世界上最顶级的开源人工智能模型”。

在这里插入图片描述
他在这里发布了以下图表，显示其基准性能：

在这里插入图片描述
Reflection 70B 通过了包括 MMLU 和 HumanEval 在内的多项基准测试，并使用 LMSys 的 LLM 去污器进行了严格测试，以确保测试结果不受污染。这些基准测试表明，Reflection 的性能始终优于 Meta 的 Llama 系列模型，并可与顶级商业模型进行正面竞争。

你可以在 "游乐场 "网站上的演示中亲自体验一下，但正如 Shumer 在 X 上指出的那样，开源人工智能模型的新王者宣布后，演示网站的流量已经爆满，他的团队正在争分夺秒地寻找足够的 GPU（图形处理单元，Nvidia 和其他公司生产的用于训练和运行大多数生成式人工智能模型的贵重芯片）来满足需求。

Reflection 70B 如何与众不同

舒默强调说，Reflection 70B 不仅能与顶级模型竞争，还能带来独特的功能，特别是错误识别和纠正功能。

正如舒默在 DM 上告诉 VentureBeat 的那样：“这个想法我已经想了好几个月了。法学硕士会产生幻觉，但他们无法纠正错误。如果你教会 LLM 如何识别并纠正自己的错误，那会发生什么呢？”

因此，这个模型被命名为 “反思”–它可以反思自己生成的文本，并在将其作为输出结果提供给用户之前评估其准确性。

该模型的优势在于一种名为 "反思调整 "的技术，它可以在最终完成响应之前发现自己推理中的错误并加以纠正。

在这里插入图片描述

Reflection 70B 为推理和纠错引入了几个新的特殊标记，使用户更容易以更有条理的方式与模型进行交互。在推理过程中，模型会在特殊标记中输出推理结果，以便在发现错误时进行实时纠正。

游戏场地演示网站包括供用户使用的建议提示，如询问 Reflection 70B 在 "草莓 "一词中有多少个字母 “r”，以及哪个数字更大（9.11 还是 9.9），这两个简单的问题是许多人工智能模型（包括领先的专有模型）都无法始终正确回答的。我们对它的测试很慢，但 Reflection 70B 最终在 60 多秒后做出了正确的反应。

在这里插入图片描述
这使得该模型特别适用于需要高精度的任务，因为它将推理分成了不同的步骤，从而提高了精度。该模型可通过人工智能代码库 Hugging Face 下载，API 访问将于今天晚些时候通过 GPU 服务提供商 Hyperbolic Labs 提供。