树莓派笔记17: 语音机器人

最新推荐文章于 2025-05-07 14:08:19 发布

皇家园林巡游者

最新推荐文章于 2025-05-07 14:08:19 发布

阅读量3k

点赞数 6

分类专栏：树莓派笔记文章标签：树莓派语音机器人

本文链接：https://blog.csdn.net/wangzhenyang2/article/details/89390015

版权

本文介绍了如何使用树莓派、麦克风、音箱和百度语音服务构建语音机器人。通过图灵机器人实现对话，并可选配LED阵列显示屏增强互动。程序使用PyAudio处理音频输入输出，集成百度的语音识别和合成API，以及图灵机器人的REST API进行交互。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

利用免费的百度语音及合成服务，图灵机器人聊天服务，在加上一点简单的硬件模块，我们就可以用树莓派搭建自己的语音机器人

1 组成模块

树莓派
支持3.5mm输入的小音箱
不到20块钱的小麦克风
可以同时接入麦克风和音箱的USB声卡
(不是必须) MAX7219 LED点阵屏

程序流程图
在这里插入图片描述

2 音频输入和输出

树莓派3B带有3.5MM音频输出口，所以可以直接接到自己的音箱上，但是没有音频输入接口，所以所以可以买一个可同时支持输入和输出的USB声卡，把麦克风和音箱接上。
在这里插入图片描述

3.5MM输出功能可能需要进入配置页面打开，执行sudo raspi-config命令进入系统配置，在Advanced Options -> Audio中打开3.5MM。

怎么用python程序控制音频输入和输出？可以直接利用PyAudio这个库，教程地址：http://people.csail.mit.edu/hubert/pyaudio/#examples ，教程中给出了很多example，可以看到使用起来是很简单的，它使用流对象来处理输入输出数据，并且支持非阻塞调用

可以用下面的代码来测试麦克风和音箱工作是否正常，这段程序就是接收麦克风的信号同时输出到音箱，如果工作正常就是一个话筒的效果

import pyaudio
import os
import sys
import time

#os.close(sys.stderr.fileno())

WIDTH=2
CHANNELS=2
RATE=44100

p=pyaudio.PyAudio()

def callback(in_data,frame_count,time_info,status):
    return (in_data,pyaudio.paContinue)

stream=p.open(format=p.get_format_from_width(WIDTH),
        channels=CHANNELS,
        rate=RATE,
        input=True,
        output=True,
        stream_callback=callback)

stream.start_stream()

while stream.is_active():
    time.sleep(0.1)

stream.stop_stream()
stream.close()

p.terminate()

这段程序使用非阻塞方法，指定回调函数为callback，我们可以从输入参数in_data中获取从麦克风输入的数据，在return的时候传入的数据则会输出到音箱。