项目中遇到一个问题,集成的语音识别模块,由于对采样率有要求,所以识别结束后保存的PCM音频文件是用的16K的采样率,而原先的项目中,包括安卓端的语音播报也都是使用8K的采样率,这样就出现个问题:是把16K的PCM转换成16K的AMR还8K的AMR?
方案一:16K PCM 转换成 16K AMR
由于对音频转换相关方面知识的欠缺,只好上谷歌、百度,也成功的找到一篇关于转换的文章:使用opencore_amr实现WAV 转 AMR (8Khz,16Khz)(更新版)
解决方案也很简单,先将PCM转换成WAV,其实PCM就是缺少信息头的WAV,所以转换WAV就是给PCM添加头信息。
这里有现成解决方案,请参考别人实现的代码,git地址如下:https://github.com/codemonkeybulucck/opencore-amrDemo-iOS
方案二:16K PCM转换成8K PCM,再转换成8K AMR
通过方案一我已经成功转换成16K的AMR,上传TFS服务器上后,发现H5无法正常播报,安卓端还没有转换成功,推荐给安卓方案二,结果他们找到了一个网上的现成解决方案:JSSRC,并且顺利完成把16K PCM转换成了8K AMR,也解决后续H5播放的问题。
通过代码了解到,JSSRC是基于SSRC的C语言版本翻译成JAVA,于是在github上找到了C语言版的源码:https://github.com/ronalde/ssrc-packaging
通过研究JAVA版和C语言版,最终在ssrc.c中新增了一个转换方法