大家有没有体验了最近的所谓的通用Agent?我请问他真的好用吗,我认为他并不好用。
问题有2点,一点是信息的来源与可靠性,另一点是价格和输出字数。
manus的金币制一次性输出7w字,快把我恶心死了,一看实际内容,具体的内容很多都是错的,还不如我直接用Grok
而心响呢,同时可以进行多并发,输出内容呢,哇好短呀,和百度的问小姐一样。
我在4月份左右就在一直和西班牙某大学,还有加拿大某大学的两个博导(他们不知道我写博客,为了个人隐私,也是我这薄脸就不说学校和姓名了( ’ - ’ * ))在那儿聊天,然后讨论过关于通用Agent的问题,他们也都指出了上述的问题,而对于其中的方案的话,我们倒是有不同的见解。
我们综合下来的见解,准确说就是类似于半自主监督,然后进行处理的方案,我们是很支持的manus这种长输出文本的,他对于专业人员的话其实还是蛮友好的,但是它的定价太高了,而且内容的话也太过高了,不如按次数收费,按tokens收费。
我们会让Gemini2.5Pro,或者是Grok3,deepseek等等他们这些深度思考模型制定一个大概的方针和策略,然后让他们自主多次思考以后,自主发现里面可能存在的问题。制定一个大纲,并且列出一系列可能出现的问题由人类一一解答,以后再交由通用Agent进行输出,然后可以定期,也就是说半个小时或者是说用户再一次上线的时候去询问一些细节,进行细节补充,或者是具体的改正,而对于一些网站问题,最好可以使用人类的账户,人机验证的问题(我们居然觉得去雇佣一些员工在背后进行真人操作是一个不错的方案)
爱你们所有人
最后,记得好好吃饭~
|•'-'•)و✧