科大讯飞离线语音识别安装与运行

本文详细介绍了如何安装和运行科大讯飞的离线语音识别SDK,包括下载SDK、理解文件结构、解决编译问题、运行示例以及理解关键函数逻辑。在编译过程中遇到的lasound库缺失问题,通过安装alsa库解决。运行示例后,解析了识别过程中的关键步骤,如QISRInit、QISRSessionBegin等函数的用途,并提到了ffmpeg用于符合识别要求的录音。
摘要由CSDN通过智能技术生成

先从官网下载sdk,有点不懂下载的逻辑..

文件解析:

bin/inc下有四个头文件:msp_errors.h msp_types.h qisr.h qtts.h

msp_errors.h msp_types.h为通用数据结构的头文件,qisr.h是语音识别用的头文件,qtts.h是语音合成用的头文件。

这是sdk中原代的解释:

copycode.gif

1.doc目录下存放开发文档等;2.lib目录下存放SDK需要调用的动态库以及需要引用的头文件。3.example目录下存放提供的示例demo,每个例子下都有Makefile文件,在当前目录make即可;4.bin目录下存放符合标准的语音文件样例、配置文件和资源文件等,make之后的example可执行程序也会拷贝至此,请在此目录下运行,否则会运行失败;5.prj目录下提供make脚本,可以快速编译例子。

copycode.gif

然后我按照它的指示,在example下的asrdome下make,然而报错:找不到 lasound,去看它的makefile文件,其中需要这个库,在网上搜了一下,解决方案如下:

sudo apt-get install alsa-base alsa-utils alsa-source libasound2-dev

重新编译ÿ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值