待修改
项目简介:运用百度语音进行声音转中文的识别与合成,智能对话使用图灵机器人,录音则,linux端用pythonaudio 模块.树莓派端因为pythonaudio不兼容问题,因此用arecord进行录音.最终代码约150行.代码发布在github上.https://github.com/luyishisi/python_yuyinduihua
0.目录:
- 1:环境搭建
- 2:百度语音合成与识别
- 3:图灵机器人
- 4:linux下使用pythonaudio进行音频解析
- 5:树莓派下使用arecord进行录音
- 6:linux整体调试
- 7:主要bug解析
- 8:源代码树莓派下的
1.环境搭建
这点非常关键,在后期多数问题都是出现在环境不兼容上.
1.1:linux 版本
# -*- coding: utf-8 -*- from pyaudio import PyAudio, paInt16 import numpy as np from datetime import datetime import wave import time import urllib, urllib2, pycurl import base64 import json import os import sys reload(sys) sys.setdefaultencoding( "utf-8" )
这部分环境最好搭建,只需要
apt-get install python-wave* 这类的安装命令就可以轻松搞定.本质上安装模块就是在找安装的命令.我一半就是把模块肯定会有的名词后面接上*用于模糊匹配.
如果有模块不懂得装,还是百度一下,难度不大.还有mpg123用来播发
1.2:树莓派版本
如果你出现这个博文下出现的错误,请果断弃坑.换用命令行录音实现,不要折腾pyaudio了.
##先更新软件包 sudo apt-get update sudo apt-get upgrade ##安装必要的程序 sudo apt-get -y install alsa-utils alsa-tools alsa-tools-gui alsamixergui
主要使用的工具
想通过终端来调整扬声器的音量,只需要输入alsamixer.这个很重要你使用的录音设备的录音音量需要这里设置,而且你可以明显的看到自己的声卡是否有问题.
使用的录音设备我用的是 https://item.taobao.com/item.htm?spm=a1z10.5-c.w4002-3667091491.40.mktumv&id=41424706