在AI技术的推动下,智能对话机器人逐渐成为我们工作、生活中的重要效率工具,乃至是伙伴,特别是为企业带来最原始最直观的“降本增效”落地实现。
作为开发者,你是否有想过基于语音技术打造一款智能对话机器人呢?
本文将可以手把手教你技术实现细节。
首先我们分析下智能对话机器人需要些什么东西:
1.语音输入:想要智能对话肯定需要语音的输入,输出。
2.语音识别:将语音识别成文字。
3.智能问答服务:将语音识别结果,输入该服务,并得到结果。
4.语音合成:将智能问答服务回答生成音频
5.语音播报:将智能问答服务回答的问题,用语音的形式播报给您听。
流程图:
语音采集:
1.使用腾讯云语音识别提供的SDK(安卓,IOS,微信小程序)
2.可以自行使用硬件录音设备采集音频
3.自己在端上(IOS,安卓等)调起录音设备采集音频
技术流程:
1.先采集音频
2.用音频流数据调用腾讯云语音识别(ASR)
3.将语音识别的文本数据调用智能问答服务
4.使用智能问答服务的回答调用腾讯云语音合成(TTS)
5.最后将语音合成产生的音频返回给端上播放
一、准备工作
1.1开通语音识别服务
笔者使用的是腾讯的语音识别,先开通一下服务,点这里 腾讯云语音识别控制台 , 点击立即开通就能开通服务了。
可以点击这里领取一个新人的体验资源包: 语音识别_实时语音识别_录音文件识别_语音转文本服务 - 腾讯云
1.2获取调用服务的API密钥
访问腾讯云的服务,都需要一个秘钥,在腾讯云访问管理的 API密钥管理页面 ,可以新建一个秘钥,这个可一定要保管好,不能泄露出去,不然就被别人盗用了。秘钥后面我们要用到。
1.3获取语音识别,语音合成SDK
语音识别SDK获取: