大家好,
最近我我在gitee 上新开源了基于WEBRTC+讯飞听写API的质检SDK库,
仓库地址:https://gitee.com/wenhuawang/recoProxy
欢迎大家访问学习交流。
首先你需要在讯飞平台注册,获取AppID,apiKey,apiSecret等信息,然后可以调用这个SDK测试。
软件架构说明
本仓库提供了一个基于google webrtc VAD + 讯飞语音听写的SDK,
供人们快速开发实时转写、离线转写的SDK。
编译后的api目录
包含
api.h 头文件
librecoProxy.so 动态库
libs 其他依赖库等
本SDK一共提供了3个接口和一个结果获取的回调接口。
创建接口用于创建一个实体。
填数据结构,持续向实体填PCM数据
然后通过回调接口回送识别结果
最后会话结束,调用释放接口,等待结果处理完毕。
1)创建接口
void* pCreateRecoProxy(const char* pUuid,int iUuidLen,void* pCbObj, vadOptions* pVadOptions, asrOptions* pAsrOptions, getResCb pCbfunc);
2)填数据结构
void pFeedDataToRecoProxy(void* pRecoProxy,char* pData, int iLen);
3)释放接口
void pCloseRecoProxy(void* pRecoPproxy);
4) 回调接口
typedef int (*getResCb) (void* pCbObj, asrMsg* pMsg, int iIsFinal);
安装教程
1. cd build/debug 编译debug 版本,如需release, cd build/release
2. 运行 sh build.sh
3. cd example 目录
4. sh build.sh
5. 设置环境变量 RECO_VAD_APPID、RECO_VAD_APIKEY、RECO_VAD_APISECRET
6. 运行 ./test2
看到类似于下面的输出
command is 0
Index : 3
asr res is 语音听写可以将语音转为文字。
BeginTime is 11479 ms
file = /tmp//test123_0003.pcm
Get res 语音听写可以将语音转为文字。
证明工作正常。
使用说明
环境变量:
RECO_VAD_APPID 讯飞账号AppID
RECO_VAD_APIKEY 讯飞账号ApiKey
RECO_VAD_APISECRET 讯飞账号 ApiSecret