java音频课程_手把手帮你视频转文本（1-视频转音频）

最新推荐文章于 2024-05-22 10:53:10 发布

weixin_39642990

最新推荐文章于 2024-05-22 10:53:10 发布

阅读量679

点赞数

文章标签： java音频课程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39642990/article/details/114471596

版权

总体技术架构

下图是整体转换流程：

先将mp4视频文件，通过ffmpeg工具库，批量转换为pcm音频文件(语音识别服务仅支持该格式)

基于百度云的技术，将pcm文件上传到百度对象存储BOS中，并将日志等记录到本地mysql数据库。

pcm文件上传完毕后，调用免费的语音识别(录音转写)服务，创建离线录音转写任务。

查询转写成功的任务，并将相关转写结果存储到本地mysql库中。

基于docx4j库，将数据库中的录音转写结果，导出为规范化的word文档。

转换结果示例

我们这里实现的是将《托马斯和他的朋友们第18季》20集MP4视频，最终转换为一个word故事文档：

下面是第一集具体对话文本表格：

视频转音频

视频转音频基于ffmpeg库来实现。ffmpeg是一个强大的跨平台音视频记录、转换方案(官网说法：A complete, cross-platform solution to record, convert and stream audio and video)

ffmpeg主要是以命令行模式来实现音视频转换和处理，我们这里实现的功能有：

将mp4文件中片头和片尾音乐剔除，截取中间片段。

将截取后的mp4文件，转换为pcm文件。

基于ffplay验证pcm可播放情况。

截取mp4文件中间片段的命令基本格式为：

ffmpeg -ss [start] -i [input] -t [duration] -c copy [output]

ffmpeg -ss [start] -i [input] -to [end] -c copy [output]

语言

方法

3705

2012.07.28 09-37-46

# 例如，以下是将t1801.mp4文件，截取从第30秒开始，截

最低0.47元/天解锁文章

weixin_39642990

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
java音频课程_手把手帮你视频转文本（1-视频转音频）

总体技术架构下图是整体转换流程：先将mp4视频文件，通过ffmpeg工具库，批量转换为pcm音频文件(语音识别服务仅支持该格式)基于百度云的技术，将pcm文件上传到百度对象存储BOS中，并将日志等记录到本地mysql数据库。pcm文件上传完毕后，调用免费的语音识别(录音转写)服务，创建离线录音转写任务。查询转写成功的任务，并将相关转写结果存储到本地mysql库中。基于docx4j库，将数据库中的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。