100个智能体实战技巧 | 如何让工作流也能处理图片

最新推荐文章于 2025-03-19 23:16:37 发布

程哥聊AI

最新推荐文章于 2025-03-19 23:16:37 发布

阅读量1.8k

点赞数 11

分类专栏： AI智能体开发和应用文章标签：人工智能 ai

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45512098/article/details/141460003

版权

AI智能体开发和应用专栏收录该内容

34 篇文章

订阅专栏

相信不少朋友都遇到过想要在工作流中处理图片但是却无从下手的情况

举个例子，扣子中有个插件叫OCR，是可以用来识别图中的文字的

然而作为一个插件，它只能在工作流中被调用，如下图 工作流 vs. 图像流

这就意味着，要使用OCR的插件就需要在工作流中上传图片。

然而，目前Coze中只有图像流是可以直接选择Image类型的输入参数进行图片上传，工作流里并没有这个类型选项

那么问题来了，如何让工作流接收并处理图片呢？

答案就是使用提示词，不过这个提示词的用法程哥也是反复尝试了多遍，最后总结出来的。

下面程哥就用这个OCR插件来做个演示，给大家做个参考：

1. 新建一个工作流test，在开始节点中添加一个输入参数pic_url，类型选择String

2. 在工作流中添加OCR的Image2tex的插件工具，并将参数url设为引用开始节点的pic_url

3. 连接各节点，试运行后发布工作流

试运行的时候需要准备一个图片的链接，作为输入参数

发布工作流并将工作流test添加到bot中

4. 设置人设与回复逻辑的提示词

关键点就是：在提示词里要明确指明，将图片链接传递给工作流的输入参数

5. 选择模型

程哥在做了多次尝试后发现，在这种应用场景下豆包的Function call模型工作不稳定，经常无法正常返回识别的内容。

但是通义千问-Max和GLM-4都没问题，其他模型暂时还没尝试。

6. 预览与调试

程哥上传了一张”证件照生成器“的截图，运行之后顺利识别出了图片中的文字，如下：

就是这样，使用这个方法就可以让一个工作流顺利地处理图片了，快去试试吧~~

Bot体验地址：https://www.coze.cn/store/bot/7402108917955870754

如果觉得程哥的文章对你有帮助，记得点赞，转发，关注哦，你的支持是我的动力

智能体精彩内容推荐：

-> AI智能体 | 智能体综合系列

-> AI智能体 | 100个好用的智能体

-> AI智能体 | 100个智能体实战技巧

-> AI智能体 | 100个好用的智能体插件

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

程哥聊AI 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。