基于Linux的语音小助手

最新推荐文章于 2024-09-13 07:56:55 发布

foxyi

最新推荐文章于 2024-09-13 07:56:55 发布

阅读量2.5k

点赞数 2

分类专栏： python

本文链接：https://blog.csdn.net/qq_37837063/article/details/88875616

版权

本文介绍了作者在Linux系统中创建语音助手的过程，包括使用pyaudio录音，通过百度API进行语音转文字，利用图灵机器人进行自动回复，再将文字转为语音输出，最后讨论了流程中的挑战和解决方案。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

闲来无事，参考文档写了一个语音助手小程序，主要流程为，录音，音频转文字，自动化处理文字并回复，将回复内容转语音输出，代码写的烂，博客也写的烂，不喜勿喷。

1.用python实现录音

看别人的文章用的是 speech_recognition实现录音并调用其recognize_google()来实现语音转换，但是国内不能访问谷歌，加上speech_recognition录音时报的错误无法处理，所以退而求其次，采用pyaudio实现录音，由于各种XXXXXXX原因，直接贴别人代码了。

import pyaudio
import wave

def speak():
	CHUNK = 1024
	FORMAT = pyaudio.paInt16
	CHANNELS = 2
	RATE = 16000
	RECORD_SECONDS = 3#设置录音时间
	WAVE_OUTPUT_FILENAME = "saying.wav"

	p = pyaudio.PyAudio()

	stream = p.open(format=FORMAT,
	                channels=CHANNELS,
	                rate=RATE,
	                input=True,
	                frames_per_buffer=CHUNK)

	print("please say....")

	frames = []

	for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
	    data = stream.read(CHUNK)
	    frame