linux系统(ubuntu)调用科大讯飞SDK实现语音识别及语音合成

1.语音识别

登录科大讯飞官网,注册账号后转到“语音识别”栏目,下载SDK,如图:

我选择了 语音听写和语音合成,都是在线的。选好后生成SDK,下载到本地,然后在linux系统中解压,并进入sample目录的iat_online_record_sample目录下。

执行 source 64bit_make.sh

此时会提示“alsa/asound.h:没有那个文件或目录”。解决办法:

sudo apt-get install libasound2-dev

然后就可以去../../bin目录下执行对应的可执行文件了。

ubutnu18的检查麦克风是否可用的设置在这里:

可以通过说话检测input level是否会随之变化。

2.语音合成 

进入到sample目录的tts_online_sample目录下。

执行 source 64bit_make.sh

然后就可以去../../bin目录下执行对应的可执行文件了。

它会根据源码中预设的文本合成语音,并生成wav文件在bin目录下。播放wav文件的方法是

安装
sudo apt-get install sox
sudo apt-get install libsox-fmt-all
然后在C代码中写上
{
    system("play tts_sample.wav");
}
就可以播放了。

于是我通过改这两个文件,合成了一个语音识别后将文字再合成语音播放出来,由于Makefile基本是相同的,因此将各自的main函数合到一起就可以了。

评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值