基于科大讯飞的语音识别 windows平台开发
最近,在做一个关于语音识别的项目,并将语音识别应用于UE4
还好,上个学期的树莓派大作业,有了相关的接触,心里有点底,做总能做出来的
就是时间周期的问题,
终于,三天打鱼两天晒网,在一个星期内把它做出来了
总结:百度是个好东西,不过必应更好
我实现的这个功能还是比较基础的,无非就是:
录音 -> 语音识别 ->数据库 -> 语音合成 -> 播放
软件需求:
科大讯飞在线SDK , VS2015 , MySQL , 录音DirectX
录音:
录音是用DirectX
这个软件的话可以去网上下载,都有的,教程也有,我就不多飞口舌了
这个的教程,我写在这里:
http://blog.csdn.net/jerry_csdn_yzr/article/details/74451437
wav文件会生成在D:\workspace(VS)\dididi\dididi\bin\Debug里面 , 自己可以去找找看
语音识别:
语音合成:
可以到官方下载SDK , 按照它的步骤来一般都是可以执行的
这个简单的嘛,重点是要去看懂它的代码
那么多的函数怎么看?mmp,一个都不认识
可以看看官方给的API,慢慢来,我都看了挺久的
这里可以下载:
http://download.csdn.net/detail/jerry_csdn_yzr/9889554
不收你们钱
一些官方的参数可以在下载下来的SDK中找到,doc文档里面有!!&#