Python调用麦克风录音生成wav文件

本博客介绍了一个使用Python实现的录音脚本,该脚本利用pyaudio和wave库进行麦克风音频采集,并存储为.wav文件。此外,文章还提到了如何结合科大讯飞的语音听写SDK,将录制的语音转换成文本,适用于语音识别应用的开发。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

import sounddevice as sd
from scipy.io.wavfile import write

def record_audio(filename="output.wav", duration=5, sample_rate=44100):
    """
    使用麦克风录制音频并保存为wav文件
    :param filename: 保存的文件名
    :param duration: 录音时长,单位秒
    :param sample_rate: 采样率,默认为44100Hz
    """
    print("开始录音...")
    audio_data = sd.rec(int(duration * sample_rate), samplerate=sample_rate, channels=2, dtype='int16')
    sd.wait()  # 等待录音完成
    print("录音完成!保存文件中...")
    
    write(filename, sample_rate, audio_data)
    print(f"音频已保存为 {filename}")

# 调用录音函数
record_audio("my_recording.wav", duration=10)

代码说明:

  • filename: 要保存的 .wav 文件的文件名。
  • duration: 录音时长,单位为秒。
  • sample_rate: 采样率,标准采样率为44100Hz。
  • sd.rec():录音方法,生成一个NumPy数组表示的音频数据。
  • write():使用 scipy.io.wavfile.write() 将音频数据保存为 .wav 文件。

废弃:以下是2018年版本

# -*- coding:utf-8 -*-
# -*- author:zzZ_CMing  CSDN address:https://blog.csdn.net/zzZ_CMing
# -*- 2018/07/12; 15:19
# -*- python3.5
import pyaudio
import wave
input_filename = "input.wav"               # 麦克风采集的语音输入
input_filepath = "音频存储位置"              # 输入文件的path
in_path = input_filepath + input_filename

def get_audio(filepath):
    aa = str(input("是否开始录音?   (是/否)"))
    if aa == str("是") :
        CHUNK = 256
        FORMAT = pyaudio.paInt16
        CHANNELS = 1                # 声道数
        RATE = 11025                # 采样率
        RECORD_SECONDS = 5
        WAVE_OUTPUT_FILENAME = filepath
        p = pyaudio.PyAudio()

        stream = p.open(format=FORMAT,
                        channels=CHANNELS,
                        rate=RATE,
                        input=True,
                        frames_per_buffer=CHUNK)

        print("*"*10, "开始录音:请在5秒内输入语音")
        frames = []
        for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
            data = stream.read(CHUNK)
            frames.append(data)
        print("*"*10, "录音结束\n")

        stream.stop_stream()
        stream.close()
        p.terminate()

        wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
        wf.setnchannels(CHANNELS)
        wf.setsampwidth(p.get_sample_size(FORMAT))
        wf.setframerate(RATE)
        wf.writeframes(b''.join(frames))
        wf.close()
    elif aa == str("否"):
        exit()
    else:
        print("无效输入,请重新选择")
        get_audio(in_path)

get_audio(in_path)

说明:

  • 这是一个可循环采样的脚本,由于输出文件名都是input.wav,所以在你保存音频的地址下永远只生成一个音频文件(后一个会覆盖前一个);
  • 可以结合科大讯飞语音听写的SDK包,完成语音转文本:
# 采集音频
get_audio(in_path)
sys.stdout.write("you ask>> ")

# 科大语音听写:语音转文本输出   请参考上一篇博客
input_seqs = keda_API.XF_text(in_path, audio_rate)
评论 15
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

月涌大江流丶

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值