项目简介
使用C++编写一个智能AI对话和语音命令执行的语音管理工具
其中可执行命令支持配置
项目技术点
C++ STL
http第三方库
图灵机器人
百度语音识别和语音合成
Linux系统/网络编程
各种第三方库和第三方工具的安装与使用
项目演示
程序启动之后,加载命令配置文件,启动本地录音工具,开始录音
程序准备识别, 将特定格式的录音推送到百度语音识别平台进行识别,返回识别完毕之后的文字信息
对比识别之后的输入文本,辨别是命令还是普通对话信息
如果是命令,进入系统命令执行模块,执行完毕,看到执行结果,一次交互完成
如果是对话信息,推送给图灵机器人,图灵机器人会智能相应对话,得到图灵机器人响应的文本,调用百
度语音合成,在本地合成语音,然后程序启动播放器,播放语音信息,完成对话信息
支持语言退出
演示项目效果
1. 使用图灵机器人
注册图灵机器人,官网:http://www.turingapi.com/
注册完毕时候,需要身份认证,安装提示来就行【图灵平台在2019-6-5号开始,需要个人进行身份认证】登录之后,就可以看看图灵官网的参考手册,也可以点击链接:https://www.kancloud.cn/turing/www-tuling123-com/718227
根据官网手册可以看出,请求是依赖http协议,请求和相应的数据都是json格式,所以,我们必须的1. 能够发起http的POST请求 2. 能够使用json进行数据序列号和反序列化
http我们不在单独写了,使用第三方库,可以选择httplib,但是后面的百度语音识别自带了httpclient,我们后面可以使用。
json进行数据序列号和反序列化功能需要我们完成,我们选择一个开源的C++库:jsoncpp
2. 使用百度语音识别
注册百度语音识别,上官网:http://ai.baidu.com/
应用的创建,全部默认即可
技术文档我们选择C++SDK
3. 准备需要的第三方库和sdk
因后续开发需要,需要先安装高版本cmake,gcc
cmake更新: