引言
随着人工智能技术的迅速发展,越来越多的AI工具正在改变科研工作的方式。Nature最新发布的《What are the best AI tools for research?》,深入分析了当前最受欢迎的AI模型,从开源到闭源,从通用到专业,针对不同的使用场景,对比了各类主流AI工具的优缺点。
原文链接:doi: https://doi.org/10.1038/d41586-025-00437-0
科研大模型Top5
DeepSeek:高性能开放权重模型
DeepSeek-R1作为一款新推出的AI模型,其性能与OpenAI的o1相当,但API使用成本更低。它采用开放权重模式,允许研究人员下载和定制模型,这一特性为资源有限的研究团队提供了构建专业推理模型的新途径。虽然运行完整模型需要强大的计算资源,但研究人员如香港中文大学(深圳)的Benyou Wang正在开发可在单机上运行的版本。该模型在数学问题解决、代码编写和假设生成方面表现出色,其完整公开的"思维过程"使研究人员能够更好地优化输出结果。在医疗诊断领域,Wang正在探索利用模型的推理能力建立从患者评估到诊断和治疗建议的清晰逻辑路径。
然而,DeepSeek-R1也存在几个显著问题:首先,其推理过程耗时较长,导致在信息查询和头脑风暴等任务上效率较低;其次,由于数据安全性问题,多个国家政府已禁止其机构工作人员使用该聊天机器人;第三,相比商业竞争对手,DeepSeek在防止有害输出方面的措施明显不足。(但是我觉得这些在国内使用应该都不算问题)
DeepSeek的主要优势包括:
-
强大的数学推理能力,可处理复杂计算问题
-
优秀的代码编写和调试能力
-
具备生成研究假设的能力,思维过程透明
-
在医疗诊断领域表现出色,可提供清晰的诊断路径
-
性价比极高,适合预算有限的研究团队
我之前讲解过Deep Seek在科研中的高阶使用指南,感兴趣的朋友可以看看这一篇:一周时间看完了最近疯传的清华大学《DeepSeek:从入门到精通》,我知道了如何在科研中把AI 用得更出彩
还有最近硅基流动邀请活动,填写邀请码就可以免费获得14元的api,想要深入个性化部署AI的朋友可以看看。欢迎在评论区互助白嫖
我的邀请码:jAzGUe4A
o3-mini :免费推理工具
o3-mini在科研学习中有以下主要应用:
-
作为一个推理模型,它采用"思维链"方式逐步解答问题,模拟人类推理过程
-
在科学和数学领域表现出色,能够处理复杂的基准测试任务
-
擅长处理技术性任务,如解决编码问题和数据重组
-
对于分析新的数学证明中的陌生概念有很好的表现,但仍无法与真正的数学家相比
值得注意的是,o3-mini是一个免费的推理工具,注册用户即可使用。OpenAI还推出了"深度研究"功能,付费用户可以使用该功能从大量网站中整理信息并生成带引用的报告,类似于进行文献综述。
在cursor中使用o3-mini进行辅助编程是一个非常不错的免费选择。
Llama:科研社区的主力工具
作为Meta AI推出的开放权重模型家族,Llama在Hugging Face平台上的下载量已超过6亿次,在科研社区中获得了广泛认可。它最大的优势在于可以在本地或机构服务器上运行,这对处理敏感数据的研究极其重要。虽然需要申请权限才能访问,但其灵活性和安全性使其成为众多研究者的首选。
Llama目前已成功应用于多个领域:
-
材料科学领域的晶体结构预测研究
-
量子计算机性能模拟
-
专业领域语言的理解和处理
-
各类定制化科研模型的基础架构
最近在硅基流动上使用的Llama 70B模型,感觉运行速度非常快,但是答案的质量相比较于Deep Seek R1有点差(可能这就是通用模型和推理模型之间的差距)。适合于一些知识点的快速问答,最合适的场景结果就是创建个人知识库,然后用Llama进行问答,突出一个快!
Claude:专业代码与技术写作助手
Claude 3.5 Sonnet是Anthropic公司开发的AI模型,在代码编写和技术写作方面表现卓越。它不仅能保持专业术语的准确性,还能优化文章的可读性。该模型具备以下特色功能:
-
强大的代码编写能力,特别受硅谷开发者欢迎
-
可同时处理和解读图表、图像和文本信息
-
具备远程操作用户计算机的能力,可控制其他软件
-
在保持技术准确性的同时优化写作风格
-
特别适合撰写科研基金申请和技术文档
据说在代码和写作过程中非常强,但我没实际上手过(据说有点贵,而且Deep Seek R1在这方面也很强)。
OLMo:真正的开源选择
对于想要深入了解AI模型内部运作机制的研究者来说,OLMo 2是最佳选择。作为完全开源模型,它不仅开放权重,还提供完整的训练数据和评估代码。虽然使用门槛相对较高,但随着免费培训课程的增加,入门难度正在降低。
OLMo 2的核心优势:
-
完整开源:提供训练数据、评估代码和模型架构
-
支持深入的模型偏差追踪和分析
-
算法决策过程完全透明
-
适合进行AI伦理和偏见研究
第一次听说这个,有用过的朋友可以在评论区说一下自己的看法。
总结
当然,选择合适的大模型只是第一步。掌握高级提示词技巧以及将AI有效整合到科研工作流程中同样至关重要。
最近我在研究如何使用Cherry Studio来整合API到统一工作区、对模型进行微调、建立提示词库以及构建本地知识库进行问答。总的来说,我非常看好这款开源软件的发展前景。
AI模型的迭代速度非常快,谁也无法预测下个月或下半年会出现什么更强大的模型。因此,建立自己的知识管理系统,并将AI合理地整合到科研工作流程中,才是最重要的。
欢迎关注我,专注AI在科研工作流中的应用