我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。
最近DeepSeek火遍全球,经常供不应求。要么卡顿,要么联网搜索不能用。ChatGPT稍好用的功能收费又太贵。
其实要说性价比之王,还是谷歌的AI大模型。最近更新的Gemini 2.0 Flash Thinking Experimental免费版,也是展示思维链的版本。便宜大碗不限速。带搜索的思考版背靠谷歌搜索引擎,效果也很不错。
Gemini 2.0 Flash免费版本也有100万token的上下文窗口,DeepSeek只有128k。2.0 Flash还推出了Thinking思考版,对标DeepSeek R1模型。也包括联网和不联网两个模型。
在数学、科学、上下文测试中2.0 Flash Thinking都更占优势:
场景1:问题回答
什么是人类文化的根源?
Gemini 2.0 Flash Thinking首先解构问题,然后针对每一个方面深入分析,最后综合回答:
针对每一个观点,Gemini还配了相应的图片(都来自中文网站)。和之前DeepSeek R1归纳的几个点大部分相同,但是DS最后的归纳总结:
人类文化的根源可以归结为通过符号系统传递的集体生存策略与意义构建。它既是适应环境的工具,也是人类试图超越生存本能、探索存在意义的载体。从石斧到人工智能,文化始终在回答两个问题:我们如何共存?我们为何存在?
更加的深刻和引人深思,这也是大家使用DeepSeek觉得它很惊艳的感受之一(对于DS提供的观点要辩证采纳)。相比之下,Gemini最后的总结就是中规中矩。
场景2:事实类讯息查询和综合
用带联网的思考版本:
我想买一款降噪耳机,让Gemini帮我联网搜索并总结:
2.0 Flash在规划行动步骤时,会用谷歌搜索找到相关测评文章,然后阅读详细评论,再总结成表格呈现给我。最后的呈现结果是这样:
中文提问和用英文提问,Gemini输出的答案会有差异吗?
Gemini 2.0 Flash Thinking Experimental和Experimental with apps两个版本,前者是不联网的思考版,后者是带联网的思考版。理论上不联网的版本中英文回答应该是一样,但是带联网的会不一样,因为搜索来源不同。
测试结果印证了我的想法。Thinking Experimental针对同一个问题的中英文回答是一样的;Experimental with apps联网版如果是英文提问,检索来源会包含英文的网站。比如上面这个静音耳机,提供的答案会更多:
总结一下,2.0 Flash Thinking Experimental和DeepSeek R1相当,略低于ChatGPT o1。
如果你需要逻辑推理能力更强的适用场景,推荐2.0 Flash Thinking Experimental;如果你需要综合近期的新闻事实等场景,推荐2.0 Flash Thinking Experimental with apps,推理能力稍弱,但是检索能力更强(背靠谷歌搜索还是不错的)。关键是都免费。