斯坦福开源端侧大模型Octopus v2，2B参数量可在移动端运行，性能超越GPT-4，准确率超Llama7B

最新推荐文章于 2024-12-18 10:27:10 发布

努力犯错

最新推荐文章于 2024-12-18 10:27:10 发布

阅读量560

点赞数 5

文章标签：图像处理人工智能深度学习开源语言模型

本文链接：https://blog.csdn.net/nulifancuoAI/article/details/138476336

版权

前言

斯坦福大学研究人员近日推出了开源端侧大模型Octopus v2，引起了广泛关注。Octopus v2拥有20亿参数量，可以在智能手机、车载系统等终端设备上高效运行，在准确性和推理速度方面都超越了GPT-4。

Huggingface模型下载：https://huggingface.co/NexaAIDev/Octopus-v2
AI快站模型免费加速下载：https://aifasthub.com/models/NexaAIDev

针对性设计与训练

Octopus v2针对自动化任务中的函数调用问题进行了优化设计。相比于传统的检索增强生成(RAG)方法，Octopus v2在训练和推理阶段采用了独特的函数token策略:

将常用函数名称标记化为特殊的函数token，使模型能够更准确地预测函数名称，提高了效率。
构建了包含相关查询、函数调用参数以及不相关查询的数据集，并引入了二进制验证机制，确保数据质量。
设计了三种不同风格的提示模板，包括单个函数调用、并行函数调用和嵌套函数调用，帮助模型学会将函数描述映射到对应的token。

这些针对性的设计使Octopus v2能够在各种复杂场景中生成准确的函数调用，无论是单独的、嵌套的还是并行的。

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

努力犯错

关注关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Octopus v2: On-device language model for super agent

c_cpp_csharp的专栏

05-20

135

语言模型在各种软件应用程序中显示出了有效性，特别是在与自动工作流相关的任务中。这些模型具有调用函数的关键能力，这对创建人工智能代理至关重要。尽管大规模语言模型在云环境中具有很高的性能，但它们往往与隐私和成本问题有关。当前用于函数调用的设备上模型面临延迟和准确性问题。我们的研究提出了一种新方法，使具有20亿个参数的设备上模型在准确性和延迟方面都超过GPT-4，并将上下文长度减少95%。与具有基于RAG的函数调用机制的Llama-7B相比，我们的方法将延迟提高了35倍。

AI资讯2024-04-08 | 斯坦福大学推出手机端运行大模型—Octopus v2，性能超越GPT-4

铃灵狗的水墨书乡

04-08

538

具有 768 个嵌入维度的 Gecko 的平均得分为 66.31，在与 7 倍大的模型和 5 倍高维嵌入进行比较时，取得了相竞争的结果。目前，硅谷的巨头们已经行动起来，竞相收购他们能够获得版权的网络数据，这场竞争几乎到了白热化的程度。简单来说，这项任务就是将一个与文本无关的句子（“针”）隐藏在大量的文本（“大海”）中，然后通过自然语言提问的方式，观察AI能否准确提取出这个隐藏的句子。通过他在X（原名Twitter）上的帖子，他提到：“为了回应进展和达成的里程碑，我们正在提升我们人工智能工程师团队的待遇。

参与评论您还未登录，请先登录后发表或查看评论

超级agent的端语言模型Octopus v2: On-device language model for super agent

skywalk8163的专栏

04-08

2086

语言模型在各种软件应用程序中显示出有效性，特别是在与自动工作流相关的任务中。这些模型具有调用函数的关键能力，这对于创建 AI 代理至关重要。尽管大规模语言模型在云环境中具有高性能，但它们通常与对隐私和成本的担忧有关。当前用于函数调用的设备端模型面临着延迟和准确性问题。我们的研究提出了一种新方法，该方法使具有 20 亿个参数的设备端模型在准确性和延迟方面都超过了 GPT-4 的性能，并将上下文长度减少了 95%。与具有基于RAG的函数调用机制的Llama-7B相比，我们的方法将延迟提高了35倍。

爆火！开源多模态大模型在手机端进行本地部署！

2301_78285120的博客

05-23

2134

节前，我们组织了一场算法岗技术&面试讨论会，邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。针对大模型& AIGC 技术趋势、大模型& AIGC 落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。大家好，今天继续聊聊科技圈发生的那些事。

超越云端：Octopus v2端侧部署实现高效能语言模型

人工智能讲师分享前沿技术

06-24

1361

在人工智能领域，大型语言模型虽然在云端环境中展现出卓越的性能，但它们在隐私保护、成本控制以及对网络连接的依赖性方面存在不足。这些问题限制了AI技术在移动设备和边缘计算场景中的应用潜力。为了克服这些限制，研究者们一直在探索如何在设备端部署更高效、更安全的语言模型。本文将介绍一种突破性的解决方案——Octopus v2模型，是由斯坦福大学的研究者Wei Chen和Zhiyuan Li开发的一种新型设备端语言模型。该模型拥有20亿参数，并在准确性和延迟方面超越了GPT-4，同时将上下文长度减少了95%。

牛！手机上轻松部署大模型全攻略！

python1222_的博客

06-12

3127

尽管当前AI的落地应用尚显稀疏，但技术的成长毕竟需要时间，大型模型的高昂推理成本无疑是其普及的桎梏。然而，**正是小模型如Llama 3和Phi3的崭露头角，让我们看到了大模型实用化的曙光。**虽然小模型的训练成本较高，但其低廉的推理成本却为整体经济带来显著的节省，特别是在为海量用户提供服务时，高性能的小模型更让AI挣脱了成本的束缚，灵活应用于各种场景。想象一下，能够根据自身需求在本地部署定制化的AI，其魅力不言而喻！

Octopus：2B 参数语言模型即可媲美 GPT-4 的函数调用性能

04-09

675

这项研究的潜在影响是巨大的，为大模型为手机端等针对应用程序特定场景的训练铺平了道路，开发人员可以精确定位其用户最常用的 API，将它们转换为模型的函数标记，然后继续部署。为此斯坦福大学采用了一种独特的功能性标记策略，基于谷歌Gemini 2B模型开发了Octopus-V2模型，专为Android API的功能调用定制，超越了基于RAG的方法，特别适用于边缘计算设备。展望未来，开发一个专注于设备推理的模型将实现云部署速度的显著提升，在本地部署时，为注重隐私或运营成本的用户提供有价值的解决方案。

【论文阅读】《Octopus v2: On-device language model for super agent》，端侧大模型的应用案例

bylander的博客

04-26

1771

这篇文章的核心就是，如何根据用户要求，让语言模型能够正确的进行API函数调用。文章的方法，简单说，就是把各种API函数的函数名，作为functional token新增到词汇表，把函数查询变成一个基于语言模型的分类问题。同时，为了选择正确的functional token，语言模型必须理解与该token相关联的含义，通过将函数描述纳入训练数据集，让模型完成相关知识学习。

20240407 每日AI必读资讯

m0_46163918的博客

04-07

1468

比Llama7B + RAG方案快36倍，性能优于 GPT-4，延迟时间小于 1 秒。- 不仅能够生成文本或回答问题，还能实际调用外部定义的函数或工具来执行特定操作。- 涵盖从大型语言模型到艺术、生物学、神经科学应用和机器人学的创新应用。- 适应多样化应用场景，特别是快速、高效处理大量信息的场合。- Cohere的模型，104B大小，针对RAG做了优化。- 可以协调调用不同的子模型（子代理）来处理特定的请求。- 平衡性能、效率和内存，适用于多语言。- 适合需要高性能和精确功能调用的场景。

大模型日报｜今日必读的8篇大模型论文

AMiner2006的博客

04-03

1725

大模型日报｜今日必读的8篇大模型论文

可在手机上运行的2B LLMs ,看看斯坦福大学的这个项目

specssss的博客

04-10

615

在此基础上，通过引入特殊的功能性标记(functional tokens)和进行细致的微调，Octopus v2能够理解和执行软件应用中的函数调用，从而实现了在设备上运行时更高的准确性和更低的延迟。在预训练模型的基础上，通过对模型进行细致的微调来适应具体的函数调用任务这一步骤涉及将功能性标记及其对应的函数描述加入训练数据中，训练模型以理解和映射这些标记到相应的软件操作上。2.优化的延迟:相比传统的基于RAG的功能调用方法，Octopus v2大幅减少了延迟，提高了推理速度，适合实时应用。

Octopus v2：斯坦福的嵌入设备专用大模型

新缸中之脑

04-15

806

这些指标突显了 Octopus v2 在缓解操作需求方面取得的变革性进展，同时保持卓越的性能水平，巩固了其作为设备上语言模型技术的巨大进步的地位。虽然基于云的模型拥有极高的准确性，但它们对持续互联网连接的依赖、潜在的隐私漏洞和高昂的成本带来了巨大的挑战。它能够大幅减少延迟和上下文长度，同时提高准确性，这对各个市场具有深远的影响，特别是那些依赖具有严格隐私和效率要求的人工智能应用程序的市场。Octopus v2 的进步有望彻底改变设备上人工智能的格局，提供无与伦比的性能，并为跨行业的创新解决方案铺平道路。

重磅上线 Octopus 2.0 ｜解读章鱼网络及其两大开拓性贡献

OctopusNetwork的博客

12-20

1403

价值捕获从「质押收入」逐步升级为「回购销毁」

Octopus V2：设备端super agent的高级语言模型

安静的软件工程师

04-07

2303

Octopus V2：设备端super agent的高级语言模型

新研究突破！斯坦福提出 Octopus v2模型让AI代理在手机上运行更快、更准确

林夕

04-07

946

3…

Octopus-V2 模型安装与使用教程

gitblog_02042的博客

12-12

947

Octopus-V2 模型安装与使用教程 Octopus-v2 项目地址: https://gitcode.com/mirrors/NexaAIDev/Octopus-v2 ...

章鱼网络 2023 年全回顾｜暨12月进展报告

OctopusNetwork的博客

01-10

1463

砥砺前行，突破迷雾，广受认可

常见问题解答：关于 Octopus-V2 模型

最新发布

gitblog_02271的博客

12-18

262

常见问题解答：关于 Octopus-V2 模型 Octopus-v2 项目地址: https://gitcode.com/mirrors/NexaAIDev/Octopus-v2 ...

斯坦福发布端侧AI模型Octopus V2：推理比GPT-4快168%，准确率超Llama7B

AIGC Studio：分享AIGC前沿知识和好玩应用，公众号同名。

04-17

1082

为了更好地适应移动设备的需求，研究团队专为Android系统打造了Octopus-V2-2B版本，力求在Android设备上实现无缝对接，应用场景涵盖了从系统管理到多设备协同工作的广泛领域。Octopus-V2-2B展现出了在复杂场景下生成独立、嵌套和并行函数调用的能力，充分体现了模型的高度灵活性和实用性。在模型训练与数据集构建方面，Octopus-V2-2B独树一帜地引入了功能Token策略，并将其贯穿于训练和推理全过程。

在大章鱼（Octopus）系统中，如何利用R语言实现大规模数据集的机器学习模型训练，并针对性能进行优化？

11-09

在实际应用中，利用大章鱼（Octopus）系统和R语言进行大规模数据集的机器学习分析，需要关注数据预处理、模型选择、训练过程以及性能优化等方面。首先，由于数据集通常很大，需要在R中加载数据时采用适当的内存管理和数据格式选择，如使用HDF5格式或Bigmemory包来提高数据读取和处理的效率。参考资源链接：[南京大学PASA大数据技术实验室发布跨平台大章鱼：R语言大数据机器学习与分析框架](https://wenku.csdn.net/doc/50ozb1komi?spm=1055.2569.3001.10343) 接下来，在模型选择阶段，需要针对数据集的特点选择合适的机器学习算法，例如决策树、随机森林或梯度提升机等。大章鱼系统内置了多种机器学习算法，并对这些算法进行了优化，以适应大规模数据集的特性。在模型训练阶段，考虑到计算资源的限制，可以通过并行计算来加速模型的训练过程。大章鱼系统支持跨平台并行计算，能够将任务分布到多台机器上执行。你可以利用R语言中的parallel包，或者大章鱼系统提供的并行框架，来实现这一点。在性能优化方面，大章鱼系统针对Hadoop和Spark的性能优化提供了支持，可以利用这些优化来提高机器学习任务的效率。具体来说，包括优化Hadoop的任务调度和Spark的RDD持久化策略，从而在保证计算准确性的基础上提升性能。最后，为了验证模型的泛化能力，需要在独立的测试集上评估模型的性能。同时，可以采用交叉验证等技术来进一步优化模型参数，提高模型的稳定性和准确性。通过以上步骤，可以有效地利用大章鱼（Octopus）系统进行大规模数据集的机器学习模型训练，并针对性能进行优化。建议深入阅读《南京大学PASA大数据技术实验室发布跨平台大章鱼：R语言大数据机器学习与分析框架》一书，获取更多细节和高级技巧，以进一步提升数据分析和机器学习的效率和效果。参考资源链接：[南京大学PASA大数据技术实验室发布跨平台大章鱼：R语言大数据机器学习与分析框架](https://wenku.csdn.net/doc/50ozb1komi?spm=1055.2569.3001.10343)