惊呆了,还能这么玩!用Python提取视频课程中的文稿

本文介绍了如何使用Python从视频中提取文字。首先,详细讲解了提取音频的参数设置,如采样率、位深和格式。接着,通过代码展示了将视频转为音频以及对长音频进行切割的实现过程。最后,讲述了音频转文字的步骤,以及整合所有文字输出的方法。
摘要由CSDN通过智能技术生成
640?wx_fmt=png
前段时间办公室出现一奇葩需求,要把一段授课视频转换为文字,为了实现这个目标我四处搜罗找了几款APP进行了多步操作,总体感觉比较麻烦。想想怎么说我们也是玩Python ,为啥不用Python呢~~说干就干,经过一番分析和搜索,还真被我搞定了,下面跟大家分享一下。


01

思路

直接写实现过程可能会有点混乱,就先讲一讲该功能的设计思路吧!

1).提取文字

这次我们的最终目的是要拿到文字稿,在一段视频中真正包含文字信息的其实不是视频文件而是音频文件,这下问题就变成从音频提取文字也就是语音识别。
关于语音转换文字,腾讯/百度/讯飞都提供有自己的API ,大家可以根据自己的习惯选用,我用的是百度API,就以此为例进行演示。

接下来就要去查百度的语音识别API文档,看看它对待提取的音频文件有什么要求,下图就是百度的python SDK文档页面:
640?wx_fmt=png
在这个文档中,对百度语音识别API所支持的音频格式进行了明确,概况起来主要有三点要求:
  • 参数:16k 采样率、16bit 位深、单声道;
  • 4
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
提取整段的txt内容,可以使用Python的文件读取操作。首先,你需要打开txt文件,然后使用read()方法来读取整个文件的内容。下面是一个示例代码: ```python with open('file.txt', 'r') as file: content = file.read() ``` 在这个示例,我们使用了open()函数来打开名为'file.txt'的txt文件,并指定了'r'模式来进行读取操作。然后,我们使用read()方法来读取整个文件的内容,并将其存储在变量content。 请注意,'file.txt'应该替换为你实际的txt文件的路径和文件名。 这样,你就可以通过content变量来获取整段的txt内容了。 #### 引用[.reference_title] - *1* [惊呆了,还能这么!用Python提取视频课程文稿](https://blog.csdn.net/weixin_43380900/article/details/102585291)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* *3* [pythontxt转为字符串_Python文件读写指南](https://blog.csdn.net/weixin_39636987/article/details/110153536)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值