前言
语音识别相关算法一般在MATLAB上进行仿真验证与实验,在工程上一般还是在VS中进行实现落地,本系列将介绍语音信号处理在C语言中的一系列应用,后期将以此为基础,再落地移植到嵌入式平台。
今天介绍sonic语音变速不变调算法的工程应用。libsonic是一个支持音频倍速播放的开源库。支持大于2倍速的播放。有ANSI C的版本,也有纯Java的版本。无外部依赖能够方便的集成进自己的应用中。
具体工程以及sonic.cpp与sonic.h文件见第一篇文章:VS语音信号处理(3) C语言调用sonic进行变速不变调工程实例
上篇文章直接用的例程中的main函数,输入输入均为PCM语音文件,经过几天的摸索,发现也可以对WAV语音文件进行直接处理,同时发现之所以生成语音的长度不一就是因为帧数的设置问题,将帧数设置为超出语音实际帧数时,不管是加速还是减速生成的语音长度也不会超出原语音长度,这里还需要进一步学习理解。直接对main函数进行调整如下:
一. main函数
// main.cpp
// sonic进行变速不变调处理
// date:2022-5-14 23:16:27
// author : C.S