AI模型：追求全能还是专精？-CSDN博客

本文链接：https://blog.csdn.net/lilinhai548/article/details/141645893

1. 前言

近日，OpenAI预计在秋季推出代号为“草莓”(Strawberry)的新AI。从专注于数学问题到处理主观营销策略，"草莓"模型展现出惊人的多样性。而这种全能型 AI 是否代表了未来趋势？相比专攻于某一领域的专业型AI产品，全能型AI产品是否一定具有更广阔的经济市场、吸引更多用户喜爱呢？

2. “草莓”(Strawberry) 是什么？

7月16日据The Information报道称，OpenAI正在开发一种新的人工智能 (AI) 模型，旨在增强AI模型的高级推理能力，它叫：“草莓”(Strawberry)。

2.1 号称GPT-4 的继任者

该模型可以为其专有的聊天机器人 ChatGPT 提供显著的数学和推理能力升级。据说这个所谓的人工智能模型已经开发了几个月，但该公司对此讳莫如深。大型语言模型 (LLM) 的存在于 7 月首次被报道。

“草莓”(Strawberry)模型是由 OpenAI 前首席科学家 Ilya Sutskever 发起的人工智能，后来在 Sutskever 离开公司后由研究人员 Jakub Pachocki 和 Szymon Sidor 进行了改进。这种人工智能在 2023 年带来了技术突破，并引发了随后的安全问题，导致公司陷入动荡。

它的主要特点是高级数学推理能力，能够解决从未见过的数学问题。这是当今聊天机器人往往难以解决的问题。它还拥有高级编程和其他技能，可以回答更主观的话题，例如营销策略。

注定要成为聊天机器人一部分的 Strawberry 版本是 AI 的较小、简化版本。OpenAI 的目标是让它保持与较大模型相同的性能水平，同时更便宜、更易于操作。据该出版物称，目前尚不清楚这个版本的 Strawberry 是否会在今年为 ChatGPT 或 GPT-4 带来任何性能提升。

据报道，“草莓” Strawberry AI 模型被用于训练 LLM，OpenAI 认为“草莓” 是 GPT-4 的继任者。

2.2 “草莓”(Strawberry) 的前身

半年前，一个名为 Q*（Q-Star）的秘密 OpenAI 贴上了头条新闻。据报道，该项目旨在让人工智能能够以新的方式进行自我训练，从而拥有规划、逻辑推理和类似人大脑的能力。它正是 “草莓”(Strawberry)发前身！

Strawberry之所以引起如此轰动，是因为其在解决数学和推理问题方面拥有先进的能力。据称，该人工智能模型可以解决它从未见过的问题。

因为人工智能模型本质上是深度学习模型，使用算法来理解和处理不同的模式。然而，当这些模式和逻辑开始变得符号化或模糊时，人工智能就开始陷入困境。这就是为什么现代人工智能聊天机器人无法解决复杂的数学或推理问题，也无法解决那些涉及语境知识或模糊性的问题。

但是，“草莓”(Strawberry) 就已经展现出超越现有 AI 模型的数学和推理能力。关于该 AI 模型的架构或参数，我们知之甚少。不过，根据报道，该 AI 模型的前身被称为 Q* （发音为 Q-star）。

两位参与该项目的人士表示，研究人员计划最早在今年秋天推出代号为 Strawberry（之前称为 Q*，发音为 Q Star）的新人工智能，作为聊天机器人的一部分（可能在 ChatGPT 内）。Strawberry 可以解决它以前从未见过的数学问题（这是当今的聊天机器人无法可靠做到的），并且还经过训练可以解决涉及编程的问题。但它并不局限于回答技术问题。

3. 大草莓的作用

OpenAI 发现，它可以使用大型版本的 Strawberry 来生成更高质量的训练数据，以输入到其 LLM 中。这种由人工智能生成的训练数据被称为“合成”数据。有了这些合成数据，公司就不再需要使用来自互联网的文本和图像来训练其人工智能模型。作为额外的好处，这些更高质量的数据还可以帮助减少人工智能所犯的错误，即所谓的幻觉。

预计 Strawberry 可以帮助 OpenAI 解决获取足够的现实世界数据以供其 LLM 使用的问题。因此，据报道，该公司正在使用大型版本的 Strawberry 来训练 GPT-4 的继任者，代号为 Orion。人们还认为，该人工智能还可以用来改进公司的代理。

OpenAI 对 Strawberry 非常有信心，它已经向美国国家安全官员展示了这项技术。此次演示可能与 OpenAI 的举措有关，即对那些感到受到人工智能力量威胁的政策制定者更加透明。在多位安全主管最近离开公司后，OpenAI 的宣传尤为重要。

4. 草莓AI会超越我们所有人吗？

OpenAI 的新项目草莓（Strawberry） 旨在实现这一目标。

OpenAI 正在通过一个名为“Strawberry”，中文名叫“草莓”的新项目突破人工智能的界限。这项秘密计划旨在赋予人工智能远超现有模型的高级推理能力。根据路透社审查的内部文件，Strawberry 旨在使人工智能不仅能够生成答案，还能自主浏览互联网并执行复杂的研究任务。这是现有人工智能模型的重大飞跃，现有人工智能模型在面对常识问题或多步骤推理任务时往往会失败。

STaR 的创建者之一、斯坦福大学教授诺亚·古德曼 (Noah Goodman) 说：“我认为这既令人兴奋又令人恐惧……如果事情继续朝这个方向发展，我们人类就需要认真思考一些问题了。”古德曼与 OpenAI 没有任何关系，对 Strawberry 也不熟悉。

Strawberry 代表着对传统 AI 训练方法的突破。它采用了“后训练”技术，即改进预先训练的模型，以提高其在特定领域的表现。一位熟悉该项目的消息人士将其比作斯坦福大学开发的一种名为“自学推理机”（STaR）的方法。STaR 允许 AI 模型通过生成自己的训练数据来迭代地提高其智能，从而有可能使它们达到并超越人类水平的推理能力。

该项目的主要目标是克服当前人工智能的局限性，即人工智能在需要长期规划和复杂问题解决的任务上举步维艰。OpenAI 的内部文件显示，Strawberry 旨在通过在专门的“深度研究”数据集上训练人工智能来实现这些能力。该数据集旨在帮助人工智能模型执行“长期任务”（LHT），包括在较长时间内规划和执行一系列操作。例如，人工智能可以负责对科学主题进行深入研究，自主浏览网页，并将其研究结果综合成连贯的见解。

这种先进人工智能的潜在应用非常广泛。从突破性的科学发现到开发复杂的软件应用程序，人工智能的推理和提前规划能力可能会彻底改变多个领域。OpenAI 设想其模型使用这些增强的功能来执行通常由软件和机器学习工程师处理的任务，从而简化工作流程并加速创新。