文 | 派森酱
来源:Python 技术「ID: pythonall」
最近在懂车帝收藏了一些感兴趣的视频,希望能整理出文字稿
这些网站或免费工具都没听过,如果是病毒或不靠谱,就显得浪费时间。
借助api的方式可以尝试,我们画图,先讲一讲该方法的实现思路吧!
流程图
从视频中提取音频可以使用moviepy模块。
由于百度API最多只支持60秒长度的音频,所以还需要使用pydub对音频文件进行切割,然后分段进行文字转换。
所以从视频到文字的大概流程应该是这样的:
❝在音频提取过程中还要对音频的采样率、声道数、码率进行设置,同时指定输出音频格式。语法格式:ffmpeg -y -i voice.mp3 -acodec pcm_s16le -f s16le -ac 1 -ar 16000 voice.pcm