linux apt 语音识别

最新推荐文章于 2023-11-15 22:25:30 发布

Karato

最新推荐文章于 2023-11-15 22:25:30 发布

阅读量2.9k

点赞数 1

文章标签：语音合成机器人 linux

本文链接：https://blog.csdn.net/zeapoem/article/details/55522260

版权

该项目利用百度语音进行声音转文字识别与合成，结合图灵机器人实现智能对话。在Linux中使用pythonaudio解析音频，而在树莓派上由于兼容问题采用arecord录音。代码已发布在GitHub，主要涉及环境搭建、语音识别、录音处理和bug解决。

摘要由CSDN通过智能技术生成

待修改

项目简介：运用百度语音进行声音转中文的识别与合成，智能对话使用图灵机器人，录音则，ｌｉｎｕｘ端用pythonaudio 模块．树莓派端因为pythonaudio不兼容问题，因此用arecord进行录音．最终代码约１５０行．代码发布在ｇｉｔｈｕｂ上．https://github.com/luyishisi/python_yuyinduihua

０．目录：

１：环境搭建
２：百度语音合成与识别
３：图灵机器人
４：linux下使用pythonaudio进行音频解析
５：树莓派下使用arecord进行录音
６：ｌｉｎｕｘ整体调试
７：主要ｂｕｇ解析
８：源代码树莓派下的

１．环境搭建

这点非常关键，在后期多数问题都是出现在环境不兼容上．

１．１：linux　版本

# -*- coding: utf-8 -*-
from pyaudio import PyAudio, paInt16
import numpy as np
from datetime import datetime
import wave
import time
import urllib, urllib2, pycurl
import base64
import json
import os
import sys
reload(sys)
sys.setdefaultencoding( "utf-8" )

这部分环境最好搭建，只需要

apt-get install python-wave* 这类的安装命令就可以轻松搞定．本质上安装模块就是在找安装的命令．我一半就是把模块肯定会有的名词后面接上＊用于模糊匹配．

如果有模块不懂得装，还是百度一下，难度不大．还有ｍｐｇ１２３用来播发

１．２：树莓派版本

如果你出现这个博文下出现的错误，请果断弃坑．换用命令行录音实现，不要折腾pyaudio了．

##先更新软件包
sudo apt-get update
sudo apt-get upgrade
##安装必要的程序
sudo apt-get -y install alsa-utils alsa-tools alsa-tools-gui alsamixergui

主要使用的工具

想通过终端来调整扬声器的音量，只需要输入alsamixer．这个很重要你使用的录音设备的录音音量需要这里设置，而且你可以明显的看到自己的声卡是否有问题．

使用的录音设备我用的是　https://item.taobao.com/item.htm?spm=a1z10.5-c.w4002-3667091491.40.mktumv&id=41424706

最低0.47元/天解锁文章