- 自己一边听一边打字
虽然说有这么多方法可以去实现这个需求,但任务量增长后,想不花钱,又想不花时间造轮子,最好的办法就是用现成的接口
百度接口使用
申请百度接口
如果想用百度接口来批量处理,需要
百度语音API地址:https://cloud.baidu.com/doc/SPEECH/index.html
from aip import AipSpeech
“”" 你的 APPID AK SK “”"
APP_ID = ‘xxx’
API_KEY = ‘xxxxxxxxxxxxxxxxxxxxxxxx’
SECRET_KEY = ‘xxxxxxxxxxxxxxxxxxxxxxxx’
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
读取文件
def get_file_content(file_path):
with open(file_path, ‘rb’) as fp:
return fp.read()
识别本地文件
result = client.asr(get_file_content(‘音频.wav’ % i), ‘wav’, 16000, {
‘dev_pid’: 1537 # 默认1537(普通话 输入法模型),dev_pid参数见本节开头的表格
})
print(result[‘result’])
如果你恰巧是用mac录的音频,那就得对音频进行