自 3 月初全球第一个通用型 AI 智能体 Manus 横空出世后,通用 AI 智能体赛道,算是被彻底引爆了!
除了 Manus 以及上周介绍的智谱的「AutoGLM沉思」外,
免费,无限使用!国产AI又出王炸,Manus瞬间不香了!一款能自主操作的AI智能体(附使用教程)
还有一些复刻 Manus 的开源项目,比较有代表性的比如字节的 Tars 等。
除了上面这些,在通用智能体赛道,不得不提的还有一个,它就是由前百度高管创立的 Genspark。
其实 Genspark 并不是一个新的 AI 产品,在去年(2024)可能已经被大家熟知了。
不过提到 Genspark,可能很多人的印象还停留在 AI 搜索上。
直到上周(4.2),Genspark 宣布推出了他们全新的产品「超级智能体」(Super Agent),才发现,原来 Genspark 已进在通用智能体的路上走了很远。
一、Genspark Super Agent 介绍
Genspark 超级代理(Super Agent),一款快速且可靠的通用 AI Agent,是一个真正能够自主思考、规划、行动并使用工具来处理你所有日常任务的终极人工智能助手。
在 Genspark 官网介绍中,Genspark 在三个难度等级上,已超过了 Manus 和 OpenAI 的 Deep Research。
而这一切,距 Manus 发布,也就仅仅一个月左右的时间。
所以,如果你还没有等到 Manus 的邀请码,可以试试 Genspark。
Genspark 不需要邀请码,所有人都可以使用。而且现在每天还送 200 credits,可以免费体验!
一起来看看吧~
二、Genspark 使用教程
打开 Genspark 官网:
https://www.genspark.ai/
使用微软账号、谷歌账号或者其他邮箱登录都可以:
下面是登录 Genspark 进来后的主界面。
点侧边栏的「超级智能体」,在输入框中输入具体需求,就可以体验 Genspark 的超级智能体功能了:
三、Genspark 使用案例
Genspark 具体能干什么?
可以先来看看 Genspark 创始人景鲲的视频介绍:
埃里克井
,赞1641
下面这些用例,Genspark 通通可以搞定。
1、制定旅游计划 + 电话预订餐厅
制定详细的旅游计划,这个功能并不新鲜,之前介绍的智谱的「AutoGLM沉思」就可以做到。
但 Genspark 可以用 AI 拨打电话,比如帮用户打电话预订餐厅,这是包括 Manus 在内的其他通用智能体目前还都没有的功能。
也是 Genspark 的一大亮点。
2、制作视频
比如上面视频中的示例:用户想制作一个短视频,用来展示如何制作某道菜。
Genspark 先是会研究菜谱,然后会使用视频生成工具(示例中使用的是 Veo 2)为每个步骤,生成对应的视频。
之后 Genspark 还会使用音频生成工具(如 ElevenLabs)为视频生成音效。
用户不需要懂视频如何制作,也不需要实际拍摄,只需要用大白话输入需求,Genspark 就会自动生成一段完整的视频!
大大提高了短视频的制作效率。
3、视频转 PPT
Genspark 可以将 Youtube 上 5 小时的视频,一键转换为 PPT。
比如我让 Genspark 根据网上某个视频的内容,做一份 PPT 出来。
Genspark 先是逐句理解视频的内容:
然后开始逐页生成 PPT。
Genspark 先会思考这一页 PPT 中应该包含哪些内容、元素,以及风格是什么。
在「思考中」这里会显示 Genspark 具体的思考过程:
思考完成后,Genspark 会生成对应的代码:
在「预览」中,可以看到该页生成好的样子:
下面帖几页 Genspark 生成的 PPT,效果还是不错的:
然后我又让 Genspark “将 PPT 整体风格改成亮色系”。
Genspark 可以在不改变文字内容的情况下,完美地调整 PPT 的风格:
4、生成动态交互式网页
Genspark 还可以一键生成交互式的可视化代码。
这项功能可以用在教学中,用来演示复杂的数学公式,生成交互式教学材料等等。
5、更多功能
还有很多用例,比如做可视化数据报告、生成海报、做网站等等,就不一一介绍了。
大家可以在 Genspark 官网上看到这些用例,点击就可以查看到该用例的所有的对话记录和实际效果:
Genspark Super Agent 官方用例展示:
https://mainfunc.ai/blog/genspark_super_agent
四、Genspark 其他智能体
Genspark 除了超级智能体外,还有其他的智能体,也可以了解一下。
点 Genspark 侧边栏的「所有智能体」,就能看到 Genspark 包括「基础智能体」和「高级智能体」在内的所有智能体了:
基础智能体
-
AI 聊天:包括 GPT-4o、o1、Claude、Gemini、DeepSeek 在内的多款大模型
-
图片工作室:包括 Flux、Ideogram、Recraft、DALL·E、Gemini Imagen 3 等多款模型
-
生成视频:包括 Kling、PixVerse、Lumalabs DreamMachine、Veo 2、Hunyuan 等
-
翻译
可以看到,Genspark 智能体集成了众多各个领域的主流模型,是全球首个 Mixture-of-Agents 系统。
它可以自动调用最佳的 AI 模型,来完成各种任务。
这也是 Genspark 能表现如此出色的原因之一。
高级智能体
-
Genspark 超级智能体
-
深入研究
-
语音通话
-
数据搜索
-
事实核查
五、结束语
以上就是关于 Genspark 的介绍。
Genspark 不需要邀请码,而且每天都有免费体验额度。
虽然说这个免费额度是挺少的,跑一两次任务就用光了,不过也算是能让大家体验到了。
短短一个多月的时间,就已经涌现出 Manus、Genspark、AutoGLM 沉思等多个通用 AI 智能体。
这一切,比所有人预想得更快。
而这也许只是刚刚开始。
当 AI Agent 开始组队攻克现实复杂任务,人类或许该重新思考——我们究竟是这场革命的主宰,还是进化链条上的新物种?
之前分享了几份「清华、北大的 DeepSeek 的学习资料」,从理论到实际应用,算是目前看到的,比较全面的 DeepSeek 学习资料了:
领取方式: