概述
在语音识别领域内,如何识别准确识别语音的第一步就是要将从音频文件中提取相关语音特征。同时对于各大语音接口如百度对于音频文件格式要求高,但是对于实际情况下,我们不可能都能拿到WAV文件,因此必须将首先将各种格式文件利用ffmpeg工具转化为WAV格式后再做下一步处理。
FFmpeg下载并解压
首先下载ffmpeg安装包。其官方下载安装地址为:http://www.ffmpeg.org/download.html。根据网页下载自行下载。
之后将压缩包解压到你电脑任意一个路径下即可。
FFmpeg环境变量配置
接下来将文件夹下的bin文件夹的路径添加到Path环境变量中即可。
之后为了测试FFmpeg是否安装成功,打开cmd输入:ffmpeg -version 如果出现如下图中出现的信息说明安装成功。
后记
对于如何利用Python结合FFmpeg结合进行音频文件的格式转换,请移步我的另一篇博客:利用python实现语音文件的特征提取