Gemini 2.0 FlashThinking模型特点
Gemini 2.0 FlashThinking模型于2024年12月20日由谷歌发布,是一款多模态推理模型。
- 推理能力与速度
- 它建立在Gemini 2.0 Flash的速度和性能之上,经过特殊训练能够利用思维强化推理能力,且受益于GeminiFlash 2.0模型的速度优势,推理能力比基础版Gemini 2.0 Flash模型更强。在一些简单测试中,能迅速(1到3秒内)准确解答对其他AI模型棘手的问题,例如计算“Strawberry”中字母“R”的数量,在对两个十进制数(9.9和9.11)比较时,能有条不紊地将问题拆解并呈现思考步骤。
- 在ChatbotArena LLM排行榜上首次亮相便位居所有类别第一,在数学、创意写作以及视觉任务等多个类别中根据初步测试结果拔得头筹,不过这些排名未涵盖OpenAI满血版o1模型。
- 输入输出限制
- 只支持32000个Token的输入内容(大约相当于50至60页的文本量),每个输出响应能够生成8000个Token。
- 多模态功能
- 自诞生之初就被赋予处理图像的能力,支持多模态推理,能够应对融合不同类型数据(如文本与视觉元素综合分析)的复杂任务,拓宽了潜在应用场景。例如Google产品负责人Logan Kilpatrick展示了该模型如何推理解决涉及视觉和文本元素的问题。
- 虽然目前暂不支持与谷歌搜索的绑定功能,也未实现与其他谷歌应用程序或外部第三方工具的集成,但多模式能力已扩展了其潜在用例。