谷歌近日发布了一款名为 **Gemini 2.0 Flash Thinking * 的新型人工智能模型,该模型专注于“推理”能力,目前已在谷歌的 AI 原型开发平台 AI Studio 上开放体验。尽管名字略显拗口,但这款模型在多模态理解、推理和编码方面展现出了强大的潜力,尤其擅长处理编程、数学和物理等领域的复杂问题。
谷歌 AI Studio 产品负责人 Logan Kilpatrick 在社交平台 X 上发文称,Gemini 2.0 Flash Thinking 是谷歌“推理之旅的第一步”。谷歌旗下人工智能研究部门 Google DeepMind 的首席科学家 Jeff Dean 也在帖子中表示,该模型“通过运用思维来加强推理”。
推理时间计算提升,带来可喜成果
Dean 进一步解释道:“当我们增加推理时间的计算量时,我们看到了可喜的成果。” 这里的“推理时间”指的是模型在思考问题时所消耗的计算资源。
拓展阅读:Gemini 2.0 Flash 体验版实测:日常视觉识别的最佳选择,关键在于其API Key现在是免费调用
基于 Gemini 2.0 Flash,借鉴 OpenAI o1 等推理模型
Gemini 2.0 Flash Thinking Experimental 基于谷歌近期发布的 Gemini 2.0 Flash 模型构建,其设计思路似乎借鉴了 OpenAI 的 o1 以及其他“推理”模型。与传统 AI 模型不同,推理模型能够有效地进行自我事实核查,从而避免一些常见的 AI 陷阱。
然而,这种能力也带来了相应的代价:推理模型通常需要更长的时间(几秒到几分钟不等)才能得出解决方案。
“边思考边解释”,推理过程透明化
在接收到提示后,Gemini 2.0 Flash Thinking 会先暂停片刻,考虑一系列相关的提示,并在此过程中“解释”其推理过程。经过一段时间后,模型会总结并输出其认为最准确的答案。
竞争加剧,多家 AI 实验室竞相布局推理模型
在 OpenAI o1 发布后,不仅是谷歌,其他 AI 实验室也纷纷加入了推理模型的研发竞赛。例如,由量化交易员资助的 AI 研究公司 DeepSeek 于 11 月初发布了其首个推理模型 DeepSeek-R1 的预览版。同月,阿里巴巴的 Qwen 团队也发布了其声称是 o1 的第一个“开放”挑战者的模型。
据彭博社 10 月份报道,谷歌内部有多个团队正在开发推理模型。随后,The Information 在 11 月份的报道中透露,该公司至少有 200 名研究人员专注于这项技术。
前景与挑战并存
尽管推理模型展现出了巨大的潜力,但并非所有人都认为这是 AI 发展的最佳方向。首先,由于推理模型需要大量的计算资源,其运行成本往往十分昂贵。其次,虽然目前推理模型在基准测试中表现出色,但其能否保持当前的发展速度仍存在不确定性。
Gemini 2.0 Flash Thinking 的发布标志着谷歌在 AI 推理领域迈出了重要一步。这款实验性模型展示了推理模型在处理复杂问题方面的优势,但也暴露了其在成本和效率方面的挑战。未来,推理模型能否成为 AI 发展的主流方向,还有待进一步观察。