![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
mengzhongsuiyi521
这个作者很懒,什么都没留下…
展开
-
语音识别之预处理==>音频格式转换
语音的声学模型我们一般使用 单声道 16bit 16000采样率的wav或pcm音频(pcm为wav去掉头信息后的部分)两种方案:一、sox转换 sox -t raw -c 1 -e signed-integer -b 16 -r 16000 INPUT_FILE OUTPUT_FILE二、ffmpeg转换ffmpeg -y -i INPUT_FILE -af 'pa...原创 2019-01-10 19:45:18 · 1029 阅读 · 0 评论 -
语音识别之预处理==>文本处理(去^M符号、去BOM头、格式转换等)
1、去掉^M符号vi编辑下使用ctrl V + ctrl M打出^M符号,然后替换为空即可。(window下^M\n结尾)%s/^M//g2、去掉UTF-8文件BOM头vim下:使用命令:set nobomb保存即可3、格式转换,使用iconv工具:iconv -f GB18030 -t UTF-8 shanghaihua_corpus.trans -o sh...原创 2019-01-10 19:49:44 · 380 阅读 · 0 评论