转载：Python调用麦克风录音生成wav文件

最新推荐文章于 2024-08-16 13:54:33 发布

qq_wuqingdefeng

最新推荐文章于 2024-08-16 13:54:33 发布

阅读量1.1k

点赞数

分类专栏：自然语言

自然语言专栏收录该内容

1 篇文章 0 订阅

订阅专栏

**事出有因：**我想调用科大讯飞的语音听写SDK包，但是这个包对输入音频有一定的要求，格式工厂毕竟不是个办法——网上找来找去，有用信息也是零零散散，所幸还是有所收获——请将以下代码写入get_audio.py文件中。
特别说明在代码后，看了还是有用的
特别说明在代码后，看了还是有用的

# -*- coding：utf-8 -*-
# -*- author：zzZ_CMing  CSDN address:https://blog.csdn.net/zzZ_CMing
# -*- 2018/07/12; 15:19
# -*- python3.5
import pyaudio
import wave
input_filename = "input.wav"               # 麦克风采集的语音输入
input_filepath = "音频存储位置"              # 输入文件的path
in_path = input_filepath + input_filename

def get_audio(filepath):
    aa = str(input("是否开始录音？   （是/否）"))
    if aa == str("是") :
        CHUNK = 256
        FORMAT = pyaudio.paInt16
        CHANNELS = 1                # 声道数
        RATE = 11025                # 采样率
        RECORD_SECONDS = 5
        WAVE_OUTPUT_FILENAME = filepath
        p = pyaudio.PyAudio()

        stream = p.open(format=FORMAT,
                        channels=CHANNELS,
                        rate=RATE,
                        input=True,
                        frames_per_buffer=CHUNK)

        print("*"*10, "开始录音：请在5秒内输入语音")
        frames = []
        for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
            data = stream.read(CHUNK)
            frames.append(data)
        print("*"*10, "录音结束\n")

        stream.stop_stream()
        stream.close()
        p.terminate()

        wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')
        wf.setnchannels(CHANNELS)
        wf.setsampwidth(p.get_sample_size(FORMAT))
        wf.setframerate(RATE)
        wf.writeframes(b''.join(frames))
        wf.close()
    elif aa == str("否"):
        exit()
    else:
        print("无效输入，请重新选择")
        get_audio(in_path)

# 联合上一篇博客代码使用，就注释掉下面，单独使用就不注释
get_audio(in_path)

特别说明：
一、这是一个可循环采样的脚本，介于输出文件名都是input.wav，所以在你保存音频的path下永远只生成一个音频文件(后一个会覆盖前一个)，你可以自己改成不循环的——但是循环的脚本用处更大，比如说做人机对话不能说一句就挂了吧，哈哈哈

二、调用的时候，也要先在你的python主程序开始处导入这个.py文件。怎么导入！！！上一篇也说了你没学会？—— 就像你导入其他外置包一样——from get_audio import get_audio；

三、你可以结合我上一篇博客Python调用科大讯飞语音听写的SDK包，把这两个代码联合使用，怎么联合使用：

    注释掉本篇博客最后一行；
    将两篇博客中的录音文件地址(本篇path是in_path，上一篇path是filepath)指向同一个目录下的同一个文件，两个的作用分别是：本篇博客代码用来采集音频，将音频存入path中，上篇博客代码通过path调用该音频，转为文本输出；
    主函数大致代码如下：

# 采集音频
get_audio(in_path)
sys.stdout.write("you ask>> ")

# 科大语音听写：语音转文本输出   请参考上一篇博客
input_seqs = keda_API.XF_text(in_path, audio_rate)

---------------------
作者：zzZ_CMing
来源：CSDN
原文：https://blog.csdn.net/zzZ_CMing/article/details/81739193
版权声明：本文为博主原创文章，转载请附上博文链接！

qq_wuqingdefeng

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录