惊呆了，还能这么玩！用Python提取视频课程中的文稿

最新推荐文章于 2024-07-16 14:32:59 发布

菜鸟学Python

最新推荐文章于 2024-07-16 14:32:59 发布

阅读量1.7k

点赞数 4

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cainiao_python/article/details/102597831

版权

本文介绍了如何使用Python从视频中提取文字。首先，详细讲解了提取音频的参数设置，如采样率、位深和格式。接着，通过代码展示了将视频转为音频以及对长音频进行切割的实现过程。最后，讲述了音频转文字的步骤，以及整合所有文字输出的方法。

摘要由CSDN通过智能技术生成

640?wx_fmt=png

前段时间办公室出现一奇葩需求，要把一段授课视频转换为文字，为了实现这个目标我四处搜罗找了几款APP进行了多步操作，总体感觉比较麻烦。想想怎么说我们也是玩Python ，为啥不用Python呢～～说干就干，经过一番分析和搜索，还真被我搞定了，下面跟大家分享一下。

01

思路

直接写实现过程可能会有点混乱，就先讲一讲该功能的设计思路吧！

1).提取文字

这次我们的最终目的是要拿到文字稿，在一段视频中真正包含文字信息的其实不是视频文件而是音频文件，这下问题就变成从音频提取文字也就是语音识别。

关于语音转换文字，腾讯/百度/讯飞都提供有自己的API ，大家可以根据自己的习惯选用，我用的是百度API，就以此为例进行演示。

接下来就要去查百度的语音识别API文档，看看它对待提取的音频文件有什么要求，下图就是百度的python SDK文档页面:

640?wx_fmt=png

在这个文档中，对百度语音识别API所支持的音频格式进行了明确，概况起来主要有三点要求：

参数：16k 采样率、16bit 位深、单声道；

最低0.47元/天解锁文章

菜鸟学Python

关注

4
点赞
踩
19

收藏

觉得还不错? 一键收藏
3
评论
惊呆了，还能这么玩！用Python提取视频课程中的文稿

前段时间办公室出现一奇葩需求，要把一段授课视频转换为文字，为了实现这个目标我四处搜罗找了几款APP进行了多步操作，总体感觉比较麻烦。想想怎么说我们也是玩Python ，为...
复制链接

扫一扫

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。