最早听说GenSpark,是它的深度研究功能:针对特定主题的综述,一次性可以给出最多附带100多条参考文献的文献综述。写出来的内容准确性和全面度也不错。
当时在测评几个大模型的深度研究功能的时候:
Deep research深度研究:ChatGPT/ Gemini/ Perplexity/ Grok哪家最强?(实测对比分析)
后台还有同学要求把GenSpark加入,对比一下。可见这款AI deep research工具普及度还不错。
前不久Manus大火,但是大家都用不上,GenSpark也顺势推出了超级智能体Super Agent功能:
基于9款主流大模型,80多个工具组合,GenSpark Super Agent可以自主选择合适的工具思考、规划、执行不同任务。
比Manus大方的是,目前每个账号每天有200积分免费额度,一个任务消耗大约几十积分不等,视频生成会更多。微软和谷歌账号可以直接登录。付费版本25美金一个月,无次数限制。
本文娜姐分别测试了它的实时数据总结、生成PPT和深度研究功能。
1 实时数据核查:
我们在写文献综述的时候,涉及关于主题的最新数据,这个一般很难在一篇文献中找齐,来看看super agent能否自主检索、汇总最新的权威数据信息:
比如我想查“近年来中国及各省市艾滋病(HIV)感染人数及流行趋势数据”,把任务发给super agent之后,它就开始规划:
5分钟后,给了一份全国和各省市(不全)的汇总数据报告:
从数据的更新日期来看,都是最新的。数据来源可靠吗?
可以看到,在数据收集与分析阶段,主要检索信息来源是各地卫健委官网:
进一步的反思优化阶段,又检索了中国CDC的周报和英文文献:
这个信息源质量还是非常高的。最后给你呈现一份图文并茂的趋势报告:
之前,不少AI检索工具也可以。同样的问题,我对比了一下秘塔AI学术检索:
虽然是开源于中文学术论文,秘塔的报告只更新到2018年,数据太陈旧。如果在标题中限定2025年呢?
秘塔AI就只查2025年的数据,因为没查到,所以给的报告就没有。相比之下,GenSpark Super Agent在数据核查方面就智能很多:
1 默认要查最新的数据;
2 这个最新是基于权威数据的更新情况,而不是限定的年月日。
这个就符合我们做研究时候的真实用法:权威机构(WHO, CDC, 官网)更新到哪一年,就用哪一年的数据,确保是最新更新就行。
2 Super Agent做PPT:
根据我们提供的文档,提炼主要内容,规划每一页PPT的内容,并生成PPT。来看看它干得怎么样,右侧是它的规划过程:
最后生成了一个14页的论文介绍PPT。
因为没有限定语言,生成的是英文版PPT,这里可以改成中文输出。
总之,包含了论文的背景、方法、结果、讨论和优缺点陈述,格式显示正常。但是,还是没有我们的论文精读可视化总结的好:
Claude 3.7高效精读论文+可视化输出:你的学术汇报新神器!
3 . Deep Research功能:
点击左侧“深度研究”,输入你的研究主题,GenSpark的深度研究智能体会像OpenAI深度研究一样,调用不同的工具,开始检索:
最后生成一份有22个参考文献的全面报告,来看看:
报告的全面性和时效性都很不错:
包含了传统和最新的上市药物治疗,以及非药物治疗方法,还有药物研发方向,基本上都是最近1-2年的信息。但是,每一个点都是很简略的概括,没有涉及机制和原理的论述,内容的深度还是远远不如OpenAI deep research。
如果想要深度报告,可以针对每一个细分主题再逐个检索。
可以看出,随着Manus迅速出圈,今年AI领域的发展潮流就是智能体应用,包括最近智谱清言发布的AutoGLM沉思,都是在多智能体应用领域的探索。其实我们已经在应用Multi-Agent了,OpenAI和Gemini的深度研究都是。今年应该会看到更多的多智能体产品,帮我们实现从想法到任务的落地。
----
今天就介绍到这里。
如果觉得有用,欢迎在看、转发和点赞!娜姐继续输出有用的AI辅助科研写作、绘图相关技巧和知识。