谷歌发布最强「科研辅助神器」！能帮你提新idea，三大真实场景实证-CSDN博客

来源：新智元

在科学探索的过程中，研究人员需要对以往发表的文献进行观察总结，提出一些新颖、可行的研究方向，最后通过全面的实验进行idea验证。

科研人员需要对探索的宽度和深度进行平衡，由于精力有限，不能探索过多的研究方向，同时还要保证对目标主题的研究深度。

最近，谷歌、斯坦福大学等机构的研究人员开发了一个多智能体、基于Gemini 2.0的AI协同科研（AI co-scientist）系统，具备跨复杂主题的综合能力和进行长期规划、推理的能力，除了传统的文献综述、总结功能之外，还可以辅助科研人员提出新的、原创知识，或是基于先前的成果制定研究假设(hypotheses)和计划(proposal)。

论文链接：

https://storage.googleapis.com/coscientist_paper/ai_coscientist.pdf

AI co-scientist系统的输入为一段用自然语言描述的研究目标，输出为全新的研究假设、详细的研究概述和实验方案。

根据科研活动本身的特性，开发者设计了多个专用智能体用来「生成、反思、排名、进化、邻近性检查、元审查（meta review）」，使用自动反馈信号来迭代生成、评估和改进假设，构成了一个自我修正、改进的循环机制，逐步生成质量更高、创新性更好的假设。

系统的核心思路就是「协助科研」，所以开发者设计了多种方式让研究人员与系统进行互动，比如「直接提供种子想法」进行探索或是对生成的结果提供「自然语言反馈」。

系统还用到了外部工具，如网络搜索和专用AI模型，以增强生成假设的依据和质量。

AI co-scientist将分配的目标解析为研究计划配置，由监督智能体（supervisor agent）负责将专用智能体分配到工作队列并分配资源，使得系统能够灵活扩展计算能力，并迭代地提高其科学推理能力，以实现指定的研究目标。

测试时计算（test-time compute）

AI co-scientist使用「测试时计算」技术来迭代推理、进化和改进输出，如进行自我对弈（self-play）科学辩论以生成新假设，对所有假设进行质量排名对比，或是不断进化假设等，可以让智能体不断进行自我批评，使用工具进行反馈以细化假设和提案。

论文链接：https://arxiv.org/abs/2408.03314

系统的自我提升能力主要依赖于Elo自动评估指标，通过对模型的输出进行对比竞赛，最终可以得到一个Elo值，研究人员分析了Elo自动评级与GPQA中diamond set（有难度的问题集合）准确率的匹配度，结果发现Elo评级与输出质量呈正相关。

AI co-scientist（蓝色线）和Gemini 2.0（红色线）的平均准确率对比，按Elo评级分组

七位领域专家在其专业领域内精心挑选了15个开放研究目标和最佳解决方案，使用自动化的Elo指标，结果发现AI co-scientist在复杂问题上的表现优于其他最先进的智能体和推理模型。

随着系统在推理和改进上花费更多时间，结果的自我评估质量提高，并超越了模型和无助的人类专家。

结果也验证了「使用从科学方法中归纳出的先验知识」进行「测试时计算」扩展的优势：系统在推理和改进上花费的时间越多，结果的自我评估质量越高，最终超越了其他模型和人类专家。

AI co-scientist的性能会随着系统在计算上花费时间更多而逐步提高

在11个研究目标的小子集上，专家们评估了AI co-scientist生成结果相对于其他基线模型在新颖性（novelty）和影响潜力（impact）的总体偏好，虽然样本量较小，但专家们普遍认为AI co-scientist更受欢迎，与之前引入的Elo自动评估指标一致。

真实场景应用

药物再利用治疗急性髓系白血病

药物研发是一个耗时且昂贵的流程，新的治疗方法需要重新启动发现和开发流程，以治疗不同的适应症或疾病。

药物再利用（drug repurposing）通过发现现有药物超出其原始预期用途的新治疗应用来克服该难题，但由于任务复杂，需要广泛的跨学科专业知识。

研究人员使用AI co-scientist来辅助预测潜在的药物再利用研究方向，模型提出了针对急性髓系白血病（AML）全新的、可再利用的候选药物，随后与合作团队通过计算生物学、专家临床医生反馈和体外实验验证了模型的预测结果，证实该药物在多个AML细胞系中，在临床相关浓度下能够抑制肿瘤活力。

三种新型AI合科学家预测的 AML 再利用药物之一的有效剂量反应曲线；KIRA6在临床相关浓度下抑制KG-1（AML细胞系）的存活，能够在较低药物浓度下降低癌细胞存活，减少了脱靶副作用的可能性

推进肝纤维化目标发现

识别新型治疗靶点比药物再利用更复杂，通常会导致假设选择效率低下、体外及体内实验优先级排序不当。人工智能辅助靶点发现有助于简化实验验证过程，降低开发时间成本。

AI co-scientist通过识别基于临床前证据并具有显著抗纤维化活性的表观遗传学靶点（3D、多细胞组织培养，由人类细胞衍生并设计来模拟人类肝脏的结构和功能），展现了其在提出、排序和生成针对发现假设的假设和实验方案方面的潜力，相关报告即将与合作者斯坦福大学共同发布。

AI co-scientist建议的治疗方案与纤维化诱导剂（阴性对照）和抑制剂（阳性对照）的治疗效果对比

解释抗菌药物耐药机制

研究人员指示AI co-scientist探索小组内已经进行过新颖发现但尚未公开的课题，解释囊膜形成噬菌体诱导的染色体岛（cf-PICIs）如何在多种细菌物种中存在？

「微生物进化出的抵抗感染治疗药物的机制」涉及到理解基因转移（接合、转导和转化）的分子机制，以及推动抗菌药物耐药性（AMR）基因传播的生态和进化压力。

AI co-scientist系统独立提出，cf-PICIs 与多种噬菌体尾部相互作用以扩大宿主范围，在之前进行的实验中得到了验证，进一步说明AI co-scientist作为辅助技术的价值，能够利用数十年前的研究结果。

AI co-scientist重新发现新型基因转移机制的时间线。蓝色：cf-PICI发现实验研究流程时间线。红色：AI co-scientist在没有先验知识的情况下发展和重现这些关键发现

参考资料：

https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/

阅读最新前沿科技趋势报告，请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828 进入。