教你怎么用Python播放音频与录音

点击上方 蓝色文字,选择置顶或星标

第一时间关注 Python 技术干货!

   阅读文本大概需要 5 分钟。

现如今,我们的学习知识的渠道越来越多,我们也要充分利用自己的感官去汲取知识。当我们看书累的时候,我们完全可以听过听书来学习,这样的平台也很多,pk 哥之前也写过关于下载喜马拉雅音频爬虫的方法:Python爬虫下载喜马拉雅音频文件。今天分享的是怎么用 Python 来播放音频与录音。

三种播放音频的方式

使用 Python 播放音频有以下几种方式:

os.system()

os.system(file) 调用系统应用来打开文件,file 可为图片或者音频文件。

缺点:要打开具体的应用,不能在后台播放音频。

Pyaudio 库

安装:pip install pyaudio

官方提供了播放音频与录音的 api ,使用十分方便,只要把Filename更改为你的音频文件的文字,就可以播放音频了。

"""PyAudio Example: Play a WAVE file."""

import pyaudio
import wave


CHUNK = 1024
FILENAME = '你的音频文件'

def play(filename = FILENAME):
   wf = wave.open(filename, 'rb')

   p = pyaudio.PyAudio()

   stream = p.open(format=p.get_format_from_width(wf.getsampwidth()),
                   channels=wf.getnchannels(),
                   rate=wf.getframerate(),
                   output=True)

   data = wf.readframes(CHUNK)

   while data != b'':
       stream.write(data)
       data = wf.readframes(CHUNK)

   stream.stop_stream()
   stream.close()

   p.terminate()


jupyter notebook

在 jupyer notebook 中播放音频可以使用以下函数:

import IPython.display as ipd
ipd.Audio(文件名)


几种读取音频的方式

Python 有很多读取音频文件的方法,内置的库 wave ,科学计算库 scipy, 和方便易用的语音处理库 librosa

下面将介绍分别使用这几种库读取音频文件:

安装

wave 是内置库直接导入即可。

scipy: pip install scipy

librosa: pip install librosa

使用

wave.open:

参数 path 为文件名,mode 为打开方式,以'rb'方式打开文件返回一个 Wave_read 对象,而以'wb'方式打开文件返回一个 Wave_write 对象。

# wave
file = wave.open(path,'rb')


scipy.io.wavfile:

参数 path 为文件名,返回 rate : 采样率(每秒采样点的个数),data : 音频数据。

from scipy.io import wavfile

# wavfile
rate, data = wavfile.read(path)

librosa.load:

参数 path 为文件名

返回 y 为音频数据,sr 为采样率

# read wav file from path
from scipy.io import wavfile
import librosa
import pyaudio

# wave
file = wave.open(path,'rb')
# wavfile
rate, data = wavfile.read(path)
# librosa
y, sr = librosa.load(path)

下面演示一个使用 wavfile 读取音频文件并且画出波形的例子

首先要计算音频到底持续了多长时间,wave 的 shape 就是总的采样点个数,除以采样频率可以得到持续的总时间(秒),乘 1000 得到总持续时间(毫秒)。接着通过 np.linsapce 产生时间的序列,最后使用 matplotlib 画出图像。

from scipy.io import wavfile
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

# 一秒采样数
sr, wave = wavfile.read('D://QQPCMgr/Desktop/python3/skip.wav')
sample_number = wave.shape[0]
total_time = int(sample_number / sr * 1000)
time_series = np.linspace(0,total_time,sample_number)
fig, ax = plt.subplots(1, 1)
ax.plot(time_series, wave)
ax.set_title('Time*Amplitude')
ax.set_xlabel('Time/ms')
ax.set_ylabel('Amplitude/dB')

Python 实现录音功能

最后再借用 pyaudio 的 api 我们可以实现连续录音功能。

其中,函数 multi_record每结束一次录音会询问 “是否进行下一次录音?”,按回车就可以进行下一次录音了。

import wave
import pyaudio
import matplotlib.pyplot as plt
import time

CHUNK = 1024
FORMAT = pyaudio.paInt16
CHANNELS = 2
RATE = 44100
RECORD_SECONDS = 5


def record(filename='output.wav'):
   """官方录音教程
   """
   
   p = pyaudio.PyAudio()
   
   stream = p.open(format=FORMAT,
                   channels=CHANNELS,
                   rate=RATE,
                   input=True,
                   frames_per_buffer=CHUNK)
   
   print("* recording")
   
   frames = []

   for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):
       data = stream.read(CHUNK)
       frames.append(data)
   
   print("* done recording")
   
   stream.stop_stream()
   stream.close()
   p.terminate()
   
   wf = wave.open(filename, 'wb')
   wf.setnchannels(CHANNELS)
   wf.setsampwidth(p.get_sample_size(FORMAT))
   wf.setframerate(RATE)
   wf.writeframes(b''.join(frames))
   wf.close()


def multi_record(num=3):
   """implement 多次录音"""
   for i in range(1,num+1):
       print('第{}次录音准备'.format(i))
       filename = 'record_{}.wav'.format(i)
       record(filename)
       time.sleep(second)
       _ = input('进行下一次录音?')


def main():
   multi_record()

if __name__ == '__main__':
   main()

 精彩推荐 

2018年Python知识圈原创文章合集
当爸妈吐槽你的微信头像,你该如何反击?
Python框架unittest如何做自动化测试?
教你用Python开发一个贪吃蛇小游戏

以梦为马,不负韶华

觉得不错,点在看、点下AD、转发朋友圈都是一种支持。

  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
要实现基于Python的实时音频信号处理,可以使用PyAudio库。PyAudio是一个用于Python音频处理库,它提供了一个接口来处理音频流的输入和输出。 以下是一个简单的实时音频处理的示例,其中包括播放声音和录制声音: ```python import pyaudio import numpy as np # 定义参数 CHUNK = 1024 RATE = 44100 # 初始化PyAudio p = pyaudio.PyAudio() # 打开音频流 (输入和输出) stream = p.open(format=pyaudio.paFloat32, channels=1, rate=RATE, input=True, output=True, frames_per_buffer=CHUNK) # 循环执行 while True: # 读取音频数据 data = stream.read(CHUNK) # 将音频数据转换为NumPy数组 data_np = np.frombuffer(data, dtype=np.float32) # 执行音频处理 processed_data = my_audio_processing_function(data_np) # 将处理后的数据写入音频流 stream.write(processed_data.tobytes()) # 关闭音频流 stream.stop_stream() stream.close() # 关闭PyAudio p.terminate() ``` 在上面的示例中,我们使用PyAudio打开了一个音频流,然后将输入和输出都打开了。然后我们进入了一个循环,在循环中读取音频数据,将其转换为NumPy数组,并执行一些音频处理。最后,我们将处理后的数据写入音频流。 要实现实时音频处理,我们需要将音频数据分成小块,每个块的大小为CHUNK,这样我们就可以在块之间执行处理。我们还可以通过修改RATE参数来控制音频流的采样率,这将影响我们可以处理的最高频率。 需要注意的是,上面的示例只提供了框架代码,实际的音频处理函数需要根据具体的需求进行编写。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值