👨💻 最近,知识星球群有同学在辅导孩子作业,也正在积极学习Coze搭建智能体,正好借此机会发挥了一下工作流的作用,为孩子搭建一个英语作业听写的智能体。
在搭建过程中也遇到了不少问题,经过斜杠君和同学的研究,最终完成了智能体的搭建,下面就把搭建过程和大家分享一下,💖 也感谢知识星球同学的分享 。
智能体作用:
将上传的英语课作业单词图片,并自动生成听写的音频,每10秒听写一个单词。
首先我们来看一下生成后的听写音频效果:
上传两张英语单词词汇图片:
一键生成听写音频,10秒钟听写一个:
英语作业单词听写,斜杠君,8分钟
🎥 本期工作流已上传至知识星球,有更详细的代码和提示词,欢迎大家加入和斜杠君学习,🧑🚀还有星球VIP群和大家一起讨论噢~
🤹 接下来,话不多说,斜杠君用最简单的方式教给大家。💖大家可以关注收藏,以免之后找不到,而且也不会错过我后面的教程。
一、基本逻辑流程
1.开始上传英语词汇图片;
2.通过大模型OCR识别插件,根据所设条件识别所需单词;
3.通过大模型进一步准确筛选所需内容,并输出文字列表;
4.通过批处理带功能插件,将文字列表转换为语音列表;
5.通过代码在语音列表中增加重复内容和空白内容,生成新的语音数组;
6.合成单词语音数组,生成一个完整语音。
二、创建工作流
1、首先新建一个工作流。
2、开始节点
开始节点设置两个变量(这里可以设置多个上传变量),用来接收两张或多个上传的英语单词图片。
3、大模型节点
大模型节点加入「OCR通用文字识别」插件,用来识别上传图片的单词,把单词提取出来成一个数组。
4、大模型节点计算单词数量
再加入一个大模型节点,用来计算每一个图片的单词个数。
5、代码节点
代码节点用来计算所有上传图片一共有多少个单词数量。
6、批处理节点
添加一个批处理节点,使用批处理节点生成所有单词的音频文件。
7、代码节点
使用一个代码节点导入一段空白音频,把每个单词中间插入一个单词听写的留白时间,然后输出一个单词音频数组。
8、合成音频
使用「音频处理工具」对单词音频数组进行合成,合成一整段音频,每个音频之间听写的留白时间。
9、结束节点
最后,使用结束节点输出合成后的音频文件。
然后把音频播放给孩子听写,家长们就可以悠闲的躺着在沙发刷手机了~
🎥 本期工作流已上传至知识星球,有更详细的代码和提示词,欢迎大家加入和斜杠君学习,🧑🚀还有星球VIP群和大家一起讨论噢~
💖大家可以关注收藏,以免之后找不到,而且也不会错过我后面的教程噢~
联系我_原文地址:最新扣子(Coze)案例教程:英语作业听写智能体:图片识别 + 语音合成 + 轻松搞定英语单词听写!!手把手教学,完全免费教程