LLM之Agent（三）：HuggingGPT根据用户需求自动调用Huggingface合适的模型

最新推荐文章于 2024-03-23 09:55:59 发布

wshzd

最新推荐文章于 2024-03-23 09:55:59 发布

阅读量364

点赞数

分类专栏： ChatGPT 笔记 NLP 文章标签： chatgpt

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wshzd/article/details/134797108

版权

笔记同时被 3 个专栏收录

175 篇文章 85 订阅

订阅专栏

81 篇文章 9 订阅

订阅专栏

62 篇文章 3 订阅

订阅专栏

浙大和微软亚洲研究院开源的HuggingGPT，又名JARVIS，它可以根据用户的自然语言描述的需求就可以自动分析需要哪些AI模型，然后去Huggingface上直接调用对应的模型，最终给出用户的解决方案。

一、HuggingGPT的工作流程

它的工作流程包括四个阶段:

任务规划：ChatGPT将用户的需求解析为任务列表，并确定任务之间的执行顺序和资源依赖关系；
模型选择：ChatGPT根据HuggingFace上托管的各专家模型的描述，为任务分配合适的模型；
任务执行：混合端点（包括本地推理和HuggingFace推理）上被选定的专家模型根据任务顺序和依赖关系执行分配的任务，并将执行信息和结果给到ChatGPT；
响应生成：最后，由ChatGPT总结各模型的执行过程日志和推理结果，给出最终的输出。

下表展示了HuggingGPT的具体细节：

不同任务的任务规划评估，如下表所示：

任务规划的格式是： [{"task": task, "id", task_id, "dep": dependency_task_ids, "args": {"text": text, "image": URL, "audio": URL, "video": URL}}]，参数的详细解释，如下表所示：

二、HuggingGPT的示例

假设我们有如下请求，来看一下HuggingGPT的完整流程：

请求：请生成一个女孩正在看书的图片，她的姿势与example.jpg中的男孩相同。然后请用你的声音描述新图片。

可以看到HuggingGPT是如何将它拆解为6个子任务，并分别选定模型执行得到最终结果的。

三、HuggingGPT不同任务的实验效果

参考文献：

[1] https://github.com/microsoft/JARVIS

[2] https://huggingface.co/spaces/microsoft/HuggingGPT

[3] https://arxiv.org/abs/2303.17580

[4] https://twitter.com/DrJimFan/status/1642563455298473986

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
LLM之Agent（三）：HuggingGPT根据用户需求自动调用Huggingface合适的模型

浙大和微软亚洲研究院开源的HuggingGPT，又名JARVIS，它可以根据用户的自然语言描述的需求就可以自动分析需要哪些AI模型，然后去Huggingface上直接调用对应的模型，最终给出用户的解决方案。混合端点（包括本地推理和HuggingFace推理）上被选定的专家模型根据任务顺序和依赖关系执行分配的任务，并将执行信息和结果给到ChatGPT；ChatGPT根据HuggingFace上托管的各专家模型的描述，为任务分配合适的模型；
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wshzd 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。