本模块集成先进的 音视频解析技术 与 自然语言处理(NLP) 能力,提供一站式创作支持。该工具精准识别并区分解说与剧情原生内容,为后续优化与重构奠定坚实基础。
借助 大模型 技术,FunAsr 可对解说文本进行智能润色,使语言更加流畅自然,并精准贴合目标受众的喜好。优化后的解说内容能无缝融入原素材,生成既保留剧情核心,又富有个性化风格的全新短剧解说视频。FunAsr 内置 智能素材获取功能,支持通过链接解析或关键词搜索快速获取视频素材,大幅提升创作效率。无论是新手还是资深创作者,都能借助该工具轻松完成高质量的短剧解说视频制作,让内容更具吸引力和市场竞争力。
操作使用
进入软件后可以直接搜索 短剧解说FunAsr
进入该模块。
文件配置
功能按钮 | 功能类别 | 功能描述 |
---|---|---|
选择视频素材 | 文件选择 | 选择需本次任务生产需要的视频文件,仅支持mp4类型文件,执行任务前自动校验路径有效性。 |
选择背景音乐目录 | 目录选择 | 选择需要添加背景音乐的文件目录,仅支持mp3和wav类型文件,任务执行会随机选择其中一个作为北京音乐,执行任务前自动校验路径有效性。 |
输出路径 | 目录选择 | 设置音频文件的保存位置,默认使用系统设定的统一输出路径,并自动校验路径有效性。 |
选择任务 | 下拉选择 | 选择历史存储在数据库中的内容数据,选择后会加载当前任务数据到项目中。 |
删除任务 | 点击按钮 | 从数据库中删除选择当前任务的数据,改操作执行后不可恢复。 |
选择字幕位置 | 点击按钮 | 点击会加载当前视频界面,用矩形框来选择视频生产字幕的位置。 |
参数配置
基础功能 解说配置提供文本转语音服务,需要 系统设置
中选择好对应的音频生产方式。
点击选项卡在这里配置解说文案的角色信息,具体操作请参考 我的AI工具箱Tauri版-通用文本转语音 进行相关操作即可。
选项 | 参数选择模式 | 说明 |
---|---|---|
选择解说角色 | 下拉选择 | 选择解说角色(如 spk0) 用于生产任务区分音频角色 |
打开临时目录 | 按钮 | 打开临时存储目录,可以访问本地素材文件 |
应用示例
s1 智能音频分离与视频解析
系统会对输入的视频内容进行智能分析,将原始的背景声音(如环境音效、背景音乐)与剧情相关部分(角色对话、情节叙述)拆分开。这一步的核心目的是帮助系统更清楚地理解视频的结构,为后续的音频处理和解说生成提供更精准的基础。初学者可以将其理解为:将视频中的不同类型声音分别提取出来,以便后续更好地调整和编辑。
选择一个需要操作的视频,这个视频在这个模块需要是解说+原剧情的视频。然后点击旁边的 选择字幕位置 选择字幕拜访的位置。这里建议选择的位置覆盖到原字幕,红色的位置需要用矩形来选择,这个区域会模糊处理,然后生成的字幕会在这个区域显示。
目录这里会随机在音乐目录下选择一个音频文件作为BGM,默认设置音频音量为20%。输出目录 用于保存生成的视频到结果目录中。
选择短剧后进行 S1解析音频
然后在参数里选择当前任务的解说人,这个AI重写的是解说人部分的内容。
对应不是非选择的数据会进行反选。
s2 个性化解说风格优化
在完成音频分离后,用户可以选择适合的视频解说风格,例如严肃、幽默或童趣等。系统会根据所选角色的特性,对解说文案进行润色与调整,使其更加生动、有吸引力,并符合视频整体的表达方式。这样的视频解说不仅更具个性,也能让观众更容易理解和接受内容。例如,童趣风格可能会让解说更加活泼,而严肃风格则可能更加专业和正式。
进行 S2解说洗稿
会将之前选择的内容数据进行重塑,这里可以对不满意的地方进行修改。
也可以点击预览查看视频片段,这里会将当前数据开始和截至时间锁定。
s3 配音生成与精准合成
经过优化的解说文案将被用于 AI 配音生成,并同步到原视频中。系统通过精确的算法匹配音频和视频片段,确保解说内容与画面无缝衔接,最终合成为完整的视频输出。简单来说,这一步就是将“改好的台词”放回视频里,并让它与画面完美同步,从而保证观众在观看时不会察觉到任何时间上的错位,使整个视频更加自然和流畅。
进行 S3视频合成
会自动的生成解说音频将内容重新合并到视频中。
可在工具选项卡 样片展示
中观看样例视频。
开发与应用
软件使用以及综合参考资料内容可以查阅
文章链接 | 内容描述 |
---|---|
AIGC工具平台Tauri+Django环境开发,支持局域网使用 | 图形桌面工具使用教程,详细介绍 Tauri+Django 环境的开发方法,支持局域网部署与使用。 |
AIGC工具平台Tauri+Django常见错误与解决办法 | 常见错误与解决办法,针对 Tauri+Django 环境下可能遇到的问题提供实用的解决方案。 |
AIGC工具平台Tauri+Django内容生产介绍和使用 | 包含当前主流新媒体领域常用的音频、视频剪辑,以及内容一键生产功能。 |
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用 | 工作流相关内容讲解,涵盖文件管理、文件汇总、软件使用教程及开发指导,附带模型下载资源。 |
AIGC工具平台Tauri+Django开源git项目介绍和使用 | 开源git项目内容讲解,涵盖项目整合包、算法模型、测试指导、项目应用,附带项目整合包下载。 |