自主人工智能代理领域正在升温。最近斯坦福大学推出了这款宝藏模型,Octopus V2设备上的语言模型,用于超级代理,而且这是一个小型模型,在准确性和延迟方面超越了GPT-4的表现,它的速度有多快,它是什么呢?毋庸置疑,这是一个设备上的语言模型,用于超级代理,意味着它可以在你的电脑上、你的手机上、任何设备上运行。
我们最近在苹果公司看到了非常相似的情况,他们也有一个设备上的模型,他们称之为RM。它基本上是一种与GPT-4相比非常小的视觉模型。例如,只有GPT-4大小的万分之八千,可以在设备上运行,对于某些视觉任务,比如理解你的电脑屏幕上、手机屏幕上写的内容,它超过了GPT-4的能力,这与Octopus V2的思路相同。

所以这是Octopus V2,他们表示语言模型,这些LLAmas,在自动工作流中可能非常有效。Octopus v2给自己设计了一种特殊的“语言”。
用通俗易懂的话来说,Octopus v2模型设计的那种特殊的“语言”其实就像是给每个功能或者动作起了个独一无二的名字。就像你给家里的宠物起名字一样,每次你叫它的名字,它就知道你在叫它,而不是别的宠物。
在这个模型里,研究者们用一些特殊的标记(可以想象成特殊的标签或者代号)来代表手机上的各种功能,比如拍照、发短信或者查天气。这些特殊
斯坦福大学的OctopusV2和苹果公司的RM展示了微型设备上的语言模型在速度和准确性上超越大型模型。这些模型通过学习特殊标记进行功能调用,解决了隐私和成本问题,且在边缘设备上表现出色,预示着自主人工智能代理领域的革新趋势。
最低0.47元/天 解锁文章
1119

被折叠的 条评论
为什么被折叠?



