普通话识别,mp3格式转wav, 采样率转换48000转16000,多通道转单通道,运用百度API,短音频,python
需要在pycharm安装百度aip, ffmpeg, pydub 的包,可识别mp3,wav,pcm, amr文件
from pydub import AudioSegment
import ffmpeg
sound=AudioSegment.from_file(r"C:\Users\xx\Desktop\样本.mp3","mp3")
sound = sound.set_channels(1) #多声道转单声道
sound.export("转换声道后样本.wav", format="wav")
ffmpe
原创
2021-07-21 18:51:29 ·
2144 阅读 ·
2 评论