【Coze】【视频】炫酷书单工作流

AI的出现,是否能替代IT从业者? 10w+人浏览 734人参与

今天给大家演示一个基于 Coze 平台 的智能工作流,它整合了大语言模型、语音合成、图像生成以及剪映插件的能力,实现了从书籍金句文案生成,到音频配音、字幕对齐、图片合成,再到成片草稿的全流程自动化制作。通过这一工作流,我们可以直观地看到 AI 在文字、声音、画面上的联动协作,快速生成完整的多媒体内容。

工作流介绍

这个工作流的核心是通过 大模型文案生成 + 配音合成 + 图像与字幕处理 + 剪映草稿插件 的串联,形成一个从文字到视频的自动化生产链。大模型负责创作专业化书籍文案,配音节点将文字转为音频,字幕对齐工具同步语音和字幕,图像生成与素材组合代码实现画面渲染,最终调用剪映插件批量生成草稿、字幕、音频和图像,完成可直接预览的视频雏形。

在这里插入图片描述

核心模型

核心部分由 大语言模型节点图像生成节点 共同支撑。大语言模型(豆包·1.5·Pro·32k)通过提示词生成书籍文案和评论,确保内容具备文学性与深度。图像生成节点则通过描述生成封面或背景图片,使得视觉效果与内容保持一致。两者结合,既保证了文案表达的专业性,又兼顾了视觉呈现的多样性。

模型名称说明
豆包·1.5·Pro·32k大语言模型,用于生成书籍金句评论文案
图像生成模型根据文字提示生成插图或封面图

Node节点

该工作流包含多个节点,既有大模型类节点(写文案员工、绘画员工2),也有插件节点(语音合成、字幕对齐、批量添加素材),以及用于逻辑编排和数据处理的代码与循环节点。各节点紧密配合,从输入到成品形成一个闭环流程。

节点名称说明
写文案员工调用大语言模型生成书籍金句文案
绘画员工2通过文字描述生成书籍插图或背景
配音员工 / 配音员工2将文案内容转为音频
循环控制字幕、音频的逐段生成与迭代
代码 / 代码_分句 / 代码_素材组合用于处理素材分句、合成和时间线逻辑
align_text_to_audio对齐字幕与音频,保证口型与文本一致
create_draft创建剪映草稿文件
add_audios向草稿批量添加音频
add_images向草稿批量添加图片
add_captions向草稿批量添加字幕

工作流程

该工作流整体以 内容生成 → 配音与字幕 → 素材组合 → 剪映成片 为主线。首先通过大模型生成书籍金句文案,再将其转化为配音音频并进行字幕对齐。接着调用图像生成与素材组合代码形成视觉画面,最后使用剪映插件完成音频、字幕、图片的批量导入,自动生成草稿视频。整个过程环环相扣,实现了从文本到多模态视频的高效生产。

流程序号流程阶段工作描述使用节点
1文案生成根据书籍名称调用大模型生成金句文案和评论写文案员工
2语音合成将生成的文案内容转为配音音频配音员工 / 配音员工2
3字幕分句与对齐将文案分句后与配音进行对齐,生成字幕时间线代码_分句、align_text_to_audio
4图像生成与素材编排根据描述生成插图/封面,结合代码逻辑合成画面与特效绘画员工2、代码、代码_素材组合
5循环控制控制字幕与音频逐段处理,输出累积结果循环、设置变量
6剪映草稿生成创建视频草稿,批量添加音频、字幕和图片素材create_draft、add_audios、add_images、add_captions
7成片输出生成可直接预览和后期编辑的草稿视频剪映草稿插件

大模型应用

书籍文案生成节点

该节点的职责是根据用户输入的书籍名称,生成富有文学感与思辨性的金句评论文案。它通过模拟书评人的表达风格,将输入信息转化为完整的书籍评论文本,并在输出中保留书籍名称和作者信息。这一过程确保了工作流的内容核心——高质量的文字表达。

节点名称Prompt信息说明
写文案员工(豆包·1.5·Pro·32k)书籍名称:《{{title}}》

# 经典书籍金句推荐
你是一位专业的书评人,清模仿董宇辉的风格,根据用户提供的书籍名称,撰写出专业且有深度的金句评论,输出 200字左右的顶级感悟文案。
#格式
输出文案,合理分段以数组列表输出每段内容
并给出书籍名称、作者名称
Prompt 的目标是让模型以书评人的身份生成精炼、深度的书籍评论,保证内容既有思想性又具备传播力。该节点在整个工作流中负责生产核心文案素材,是后续配音、字幕和图像生成的基础。

图像生成节点

该节点用于将用户提供的文字描述转化为图像,生成与文案主题相匹配的视觉素材。它通过自然语言提示词驱动图像生成模型,为最终视频提供封面或背景画面,使得作品不仅有声音和文字,还能有生动的视觉表现。

节点名称Prompt信息说明
绘画员工2(图像生成模型){{prompt}}该 Prompt 直接将用户输入作为图像生成提示,模型根据描述生成对应画面。设计目标是快速产出契合内容主题的封面或插图,用于视频的开场或背景,从而提升观感效果。

使用方法

开始节点

在开始节点中,用户需提供书籍相关的输入信息,例如书籍标题、封面图片、背景图片等基础素材。这些信息将作为后续大模型生成文案、语音合成和图像生成的输入。

字段名含义数据类型
title用户输入的书籍名称,用于文案生成str.String
pic封面图片链接str.String
bg_pic背景图片链接str.String
bgm背景音乐文件str.String

结束节点

结束节点将生成的视频草稿信息输出,供用户在剪映中直接使用或后期编辑。输出数据主要包含草稿的链接和 ID,确保用户能快速定位成品视频。

字段名含义数据类型
draft_id剪映生成的草稿 ID,用于后续访问和编辑str.String
draft_url草稿的在线访问链接str.String

应用场景

该工作流主要面向 书籍解读、知识分享、短视频内容创作 的自动化场景。它通过大模型生成文案,再结合语音、字幕、图像生成与视频编辑插件,能够帮助创作者快速产出完整视频。典型用户包括知识博主、教育机构以及新媒体运营人员,他们可以使用此流程批量化生产高质量的解读视频,既保证了内容的专业性,也兼顾了视觉和听觉的体验。最终效果是让文字、声音、画面自然融合,形成有深度又有观赏性的多模态视频内容。

应用场景使用目标典型用户展示内容实现效果
书籍金句解读将书籍文案转化为视频内容知识博主、自媒体创作者文案评论 + 配音 + 字幕 + 图像快速生成有声有画的书籍解读短视频
教育讲解视频将教学文案自动转化为课程视频教育机构、教师教学文案 + 配音 + 多图演示提升内容输出效率,降低视频制作成本
知识分享短片将长文本拆分为多段知识点解读短视频运营者知识点字幕 + 配音解说批量化生成短视频,增强传播力
营销推广将产品介绍文案转化为营销短片品牌方、营销团队宣传文案 + 背景音乐 + 动画效果快速生成宣传视频,提升用户吸引力

开发与应用

更多 AIGC 与 Agent工作流 相关研究学习内容请查阅:

AIGC 与 Agent 工作流应用汇总

更多内容桌面应用开发和学习文档请查阅:

AIGC工具平台Tauri+Django环境开发,支持局域网使用
AIGC工具平台Tauri+Django常见错误与解决办法
AIGC工具平台Tauri+Django内容生产介绍和使用
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用
AIGC工具平台Tauri+Django开源git项目介绍和使用

<think>我们正在讨论Coze视频制作工作流。根据引用内容,特别是引用[1]和引用[2],我们可以构建一个基于Coze平台的一站式视频制作工作流。这个工作流包括生成对话内容、切割字幕、生成音频、背景图、关键词提取、动画效果,然后整合数据并合成视频。用户的问题:“请问coze视频制作工作流教程”,因此我们需要提供一个清晰的教程步骤。根据引用[1]中描述的流程:1.开始节点:输入参数(如书名、作者、文字水印)给模型,模型输出对话内容。2.使用代码节点切割字幕。3.素材处理:同时进行生成音频、生成背景图、提取关键词、生成动画效果。4.数据整合:将上述素材整合并配置参数。5.视频合成:使用剪映小助手插件合成视频。同时,引用[3]提供了一个生成绘画提示词的技能,可以用于生成背景图的提示词,这可以整合到工作流中。因此,我们可以设计一个详细的Coze工作流教程,包括以下步骤:步骤1:创建Coze工作流步骤2:设置开始节点(输入参数)步骤3:使用大模型生成对话内容步骤4:切割字幕步骤5:并行处理多个素材生成任务(音频、背景图、关键词、动画效果)步骤6:数据整合步骤7:视频合成下面我们详细说明每个步骤。注意:由于Coze平台的具体操作可能会更新,这里主要根据引用内容描述逻辑流程。教程开始:###Coze视频制作工作流教程本教程将指导你如何使用Coze平台创建一个自动化生成解读书籍类短视频工作流。整个工作流包括生成对话内容、生成音频、背景图、关键词提取、动画效果,以及最终视频合成。我们将以制作一个“假如书籍会说话”类型的视频为例。####步骤1:创建工作流并设置开始节点在Coze平台中创建一个新的工作流。在开始节点中,定义三个输入参数:`书名`、`作者`、`文字水印`。这些参数将用于后续步骤。####步骤2:使用大模型生成对话内容添加一个“大模型”节点(可能是GPT等模型),输入提示词,根据开始节点传入的参数生成一段关于书籍的对话文本。提示词示例:```你是一个书籍解说的专家,请根据提供的书籍信息,生成一段两个角色(书籍和读者)之间的对话,对话要生动有趣,能够吸引观众。书籍信息:书名:{{书名}}作者:{{作者}}```该节点输出一段对话文本。####步骤3:切割字幕由于生成的对话文本较长,我们需要将其切割成适合视频字幕的短句。添加一个“代码”节点,使用Python或其他支持的脚本语言,将对话文本按照句子或标点符号切割成多行字幕。例如,可以按句号、问号、感叹号分割,并确保每行字幕不要太长。####步骤4:并行生成素材在切割字幕的同时,我们可以并行执行以下四个任务:1.**生成音频**:使用文本转语音(TTS)节点,将切割后的每一句字幕转换成语音。可以选择不同的声音角色(例如,书籍用男声,读者用女声)。2.**生成背景图**:根据对话内容,生成与当前对话场景匹配的背景图。这里可以使用绘画提示词生成技能(如引用[3]所述),然后调用图像生成节点(如DALL·E等)。例如,对于一句关于敲背的养生对话,可以生成“一位身着古装长袍的女子,手持细长木槌,在古色古香的庭院中,微微侧身扬起木槌轻敲自己背部”的图片。3.**提取关键词**:使用自然语言处理节点,从对话文本中提取关键词。这些关键词将在视频中作为重点显示。4.**生成动画效果**:根据关键词和对话内容,生成一些动画效果(如文字高亮、转场动画等)。这一步可能需要使用代码节点或专门的动画生成节点。注意:这些任务可以同时进行,以提高效率。####步骤5:数据整合添加一个“数据整合”节点,将上述四个任务生成的结果(音频文件、背景图列表、关键词列表、动画效果配置)以及字幕文本进行整合,并按照时间轴对齐。同时,配置视频参数(如分辨率、时长等)。####步骤6:视频合成最后,使用“剪映小助手”插件(或类似的视频合成工具)进行视频合成。该节点将接收整合后的数据,并执行以下操作:-将音频与对应的背景图同步-在视频中添加字幕(根据切割后的字幕和音频的时间点)-在适当位置显示关键词(可以添加动画效果)-添加文字水印(从开始节点传入)-调整视频的整体风格和节奏合成完成后,输出视频文件。####总结通过以上步骤,你可以自动化生成一个解读书籍的短视频。整个工作流Coze平台上搭建,利用了大模型、代码节点、TTS、图像生成、视频合成插件等多种功能。为了优化这个工作流,你可以:-调整大模型提示词,使对话更吸引人-优化字幕切割算法,使字幕更自然-尝试不同的TTS声音和图像风格-调整视频合成参数,提升视频质量希望这个教程对你有帮助!§§相关问题§§1.Coze工作流中如何优化大模型生成对话内容的质量?2.除了剪映小助手,Coze还支持哪些视频合成插件?3.如何为不同的书籍类型定制背景图风格?4.Coze工作流的并行任务处理有什么注意事项?</think>### Coze视频制作工作流教程 以下是基于引用资料的Coze视频制作完整工作流,整合了内容生成、素材处理和视频合成三大模块,适用于“书籍解读”“养生科普”等爆款短视频场景: --- #### **一、工作流核心架构** ```mermaid graph TB A[输入参数] --> B(生成对话内容) B --> C(切割字幕) C --> D1(生成音频) C --> D2(生成背景图) C --> D3(提取关键词) C --> D4(生成动画效果) D1 & D2 & D3 & D4 --> E[数据整合] E --> F(视频合成) F --> G[成品视频] ``` --- #### **二、详细操作步骤** 1. **输入参数(开始节点)** - 必填参数:`书名`、`作者`、`文字水印` - 示例输入: ```json { "书名": "黄帝内经", "作者": "佚名", "文字水印": "@养生知识库" } ``` 2. **生成对话内容(大模型节点)** - **提示词设计**(引用[3]优化版): ``` 你是一位精通《{{书名}}》的古代学者,用两个角色的对话解读书中核心观点: 角色1:提问者(现代读者) 角色2:书籍化身(符合原著风格) 要求: 1. 对话包含3轮问答,每轮不超过40字 2. 突出“{{关键词}}”的养生方法 3. 结尾引导观众点赞 ``` - 输出示例: > 读者:“《黄帝内经》说背要常敲,具体怎么做?” > 书籍:“取细长木槌,于巳时轻敲督脉,每侧九下为宜”[^3]。 3. **切割字幕(代码节点)** - 使用Python拆分对话为逐句字幕: ```python def split_dialogue(text): return [line.strip() for line in text.split('\n') if line] # 输入:模型生成的对话文本 # 输出:["读者:...", "书籍:...", ...] ``` 4. **并行素材处理** - **生成音频**:调用TTS插件(推荐Azure语音),为每个角色分配不同音色 - **生成背景图**(引用[3]关键步骤): - 提示词示例: ``` “古装女子持木槌,在青砖庭院侧身轻敲背部,水墨风格,留文字区域” ``` - 工具:DALL·E 3 或 Stable Diffusion - **提取关键词**:NLP插件抓取核心词(如“督脉”“巳时”) - **生成动画效果**:使用Lottie插件创建字幕浮现/插图缩放动画 5. **数据整合(JSON结构化)** ```json { "audio": "path/audio.mp3", "images": ["bg1.png", "bg2.png"], "keywords": ["督脉", "巳时"], "subtitles": [ {"start": 0.5, "text": "读者:...", "pos": "top_left"}, {"start": 3.2, "text": "书籍:...", "pos": "bottom_right"} ] } ``` 6. **视频合成(剪映小助手插件)** - 关键操作: - 绑定音频与字幕时间轴 - 插入动态关键词浮动特效 - 添加文字水印与转场动画 - 输出分辨率:1080x1920(竖版) --- #### **三、高阶优化技巧** 1. **流量密码设计**(引用[1]经验): - 前3秒加入冲突提问(如“古人熬夜如何补救?”) - 每20秒设置“神转折”话术(如“这个方法医生从不外传!”) 2. **DeepSeek多模态增强**(引用[2]方案): - 用DeepSeek-VL生成分镜脚本: ``` /describe_image 背景图 输出:镜头焦距建议+色彩优化方案 ``` 3. **冷启动数据包**: - 附赠资源(引用[2]): > [AI大模型入门学习思维导图] > [精品Prompt工程手册] > [10种爆款开场白模板] --- #### **四、常见问题解决方案** | 问题 | 解决方法 | |---------------------|-----------------------------| | 对话生硬 | 添加角色性格参数(书籍化身带威严感) | | 字幕音频不同步 | 用FFmpeg节点校准时间戳 | | 背景图风格不一致 | 限定提示词如“统一水墨淡彩” | | 视频完播率低 | 在第8秒插入进度条动画提醒 | ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mr数据杨

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值