Python音频处理勇敢到的操作

最新推荐文章于 2024-07-15 10:36:04 发布

代码输入中...

最新推荐文章于 2024-07-15 10:36:04 发布

阅读量1.4k

点赞数 2

文章标签： python 开发语言音视频 pycharm 数据分析

本文链接：https://blog.csdn.net/m0_59485658/article/details/128056086

版权

本文详细介绍了Python环境下对.wav音频文件的处理，包括批量读取文件名、读取与写入音频、播放音频、加窗分帧以及生成语谱图等操作，重点使用了wave和pyaudio库。

摘要由CSDN通过智能技术生成

前言

本文主要记录python下音频常用的操作，以.wav格式文件为例。其实网上有很多现成的音频工具包，如果仅仅调用，工具包是更方便的。

1、批量读取.wav文件名：

import os

filepath = "./data/" #添加路径

filename= os.listdir(filepath) #得到文件夹下的所有文件名称

for file in filename:

print(filepath+file)

　　这里用到字符串路径：

1.通常意义字符串(str)
2.原始字符串，以大写R 或 小写r开始，r''，不对特殊字符进行转义
3.Unicode字符串，u'' basestring子类

如：

path = './file/n'

path = r'.\file\n'

path = '.\\file\\n'

　　三者等价，右划线\为转义字符，引号前加r表示原始字符串，而不转义（r:raw string）.

常用获取帮助的方式：

>>> help(str)
>>> dir(str)
>>> help(str.replace)

2、读取.wav文件

wave.open 用法：

1	`wave.open(file,mode)`

　　mode可以是：

‘rb’，读取文件；

‘wb’，写入文件;

不支持同时读/写操作。

Wave_read.getparams用法：

f = wave.open(file,'rb')

params = f.getparams()

nchannels, sampwidth, framerate, nframes = params[:4]

　　其中最后一行为常用的音频参数：

nchannels:声道数

sampwidth:量化位数（byte）

framerate:采样频率

nframes:采样点数

单通道

对应code:

import wave

import matplotlib.pyplot as plt

import numpy as np

import os

filepath = "./data/" #添加路径

filename= os.listdir(filepath) #得到文件夹下的所有文件名称

f = wave.open(filepath+filename[1],'rb')

params = f.getparams()

nchannels, sampwidth, framerate, nframes = params[:4]

strData = f.readframes(nframes)#读取音频，字符串格式

waveData = np.fromstring(strData,dtype=np.int16)#将字符串转化为int

waveData = waveData*1.0/(max(abs(waveData)))#wave幅值归一化

# plot the wave

time = np.arange(0,nframes)*(1.0 / framerate)

plt.plot(time,waveData)

plt.xlabel("Time(s)")

plt.ylabel("Amplitude")

plt.title("Single channel wavedata")

plt.grid('on')#标尺，on：有，off:无。

　　结果图：

多通道

这里通道数为3，主要借助np.reshape一下，其他同单通道处理完全一致，对应code:

# -*- coding: utf-8 -*-

"""

Created on Wed May 3 12:15:34 2017

@author: Nobleding

"""

import wave

import matplotlib.pyplot as plt

import numpy as np

import os

filepath = "./data/" #添加路径

filename= os.listdir(filepath) #得到文件夹下的所有文件名称

f = wave.open(filepath+filename[0],'rb')

params = f.getparams()

nchannels, sampwidth, framerate, nframes = params[:4]

strData = f.readframes(nframes)#读取音频，字符串格式

waveData = np.fromstring(strData,dtype=np.int16)#将字符串转化为int

waveData = waveData*1.0/(max

最低0.47元/天解锁文章

代码输入中...

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫