最近小编与中科院的同学吃饭的时候,偶然讲起来他最近的一个项目就是利用语音识别的技术和聊天机器人来实现人机交互,简而言之就是我们说话,程序识别出来我们讲的是什么,然后通过聊天机器人跟我们实现交流。我感到非常的有意思,于是决定简单实现一下,跟大家一起来学习一下。
01.
使用模块
本次项目主要用到了三个主要的模块,分别为:
speech_recognition python函数库,其主要的作用是通过麦克风来将我们的录音保存到指定的文件中;
百度语音识别的API接口,其主要作用是将我们的语音进行识别并转换为文字;
青云客提供的聊天机器人的API接口,主要作用是与我们进行智能聊天。
有了三个主要模块的简短介绍,下面介绍一下程序的设计流程。
首先是利用speech_recognition来进行语音的录入,程序如下:
上面的程序中,我们首先调用电脑的麦克风,然后获取音频数据后,将我们的数据保存到根目录下的recording.wav文件中。运行上述程序后,我们只需要确保我们电脑的麦克风正常工作,就可以实现录音的功能。