提取音频之后就要把音频转成文字了,目前市面上有很多方式都可以快速的将视频里的音频内容转成文字
-
科大讯飞、知意等付费平台
-
剪映、Pr等剪辑如案件生成字幕
-
百度云、腾讯云等国内接口
-
GOogle、IBM、Bing等国外接口
-
自己造轮子,语音识别训练
-
自己一边听一边打字
虽然说有这么多方法可以去实现这个需求,但任务量增长后,想不花钱,又想不花时间造轮子,最好的办法就是用现成的接口
百度接口使用
申请百度接口
如果想用百度接口来批量处理,需要
百度语音API地址:https://cloud.baidu.com/doc/SPEECH/index.html
from aip import AipSpeech
“”" 你的 APPID AK SK “”"
APP_ID = ‘xxx’
API_KEY = ‘xxxxxxxxxxxxxxxxxxxxxxxx’
SECRET_KEY = ‘xxxxxxxxxxxxxxxxxxxxxxxx’
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
读取文件
def get_file_content(file_path):
with open(file_path, ‘rb’) as fp:
return fp.read()
识别本地文件
resul