python wav文件与wave bytes的转化

# -*- coding: utf-8 -*-
import wave
import pylab as pl
import numpy as np

# 打开WAV文档
f = wave.open(r"E:\aryaxyang\test1.wav", "rb")

# 读取格式信息
# (nchannels, sampwidth, framerate, nframes, comptype, compname)
params = f.getparams()
nchannels, sampwidth, framerate, nframes = params[:4]

# 读取波形数据
str_data = f.readframes(nframes)
f.close()

#将波形数据转换为数组
wave_data = np.fromstring(str_data, dtype=np.short)
wave_data.shape = -1, 2
temp_data = wave_data
temp_data.shape = 1, -1
temp_data = temp_data.astype(np.short)
f = wave.open(r'temp\aaa.wav', 'wb')
#配置声道数、量化位数和取样频率
f.setnchannels(nchannels)
f.setsampwidth(sampwidth)
f.setframerate(framerate)
#将wav_data转换为二进制数据写入文件
f.writeframes(temp_data.tostring())
f.close()
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
要去除 WAV 文件中的人声,可以使用声音分离技术,常用的方法是独立分量分析(Independent Component Analysis, ICA),它可以将混合在一起的声音信号分离成不同的独立信号。 以下是使用 Python 实现声音分离的基本步骤: 1. 载入 WAV 文件,并将其转换为 numpy 数组。 ```python import wave import numpy as np with wave.open('example.wav', mode='rb') as wav_file: # 获取声道数、采样宽度、采样率和帧数 num_channels = wav_file.getnchannels() sample_width = wav_file.getsampwidth() sample_rate = wav_file.getframerate() num_frames = wav_file.getnframes() # 读取所有帧数据 wav_data = wav_file.readframes(num_frames) # 将二进制数据转换为 numpy 数组 audio_array = np.frombuffer(wav_data, dtype=np.int16) ``` 2. 对声音信号进行预处理,例如将采样率调整为 44100Hz,并将数据类型转换为 float32。 ```python from scipy import signal # 将采样率调整为 44100Hz resampled_audio, resampled_rate = signal.resample(audio_array, num_frames * 44100 // sample_rate, audio_array) # 将数据类型转换为 float32 audio_data = resampled_audio.astype(np.float32) / 32768.0 ``` 3. 使用 ICA 对声音信号进行分离,得到不同的独立信号。 ```python from sklearn.decomposition import FastICA # 创建 FastICA 对象 ica = FastICA(n_components=num_channels) # 对声音信号进行分离 separated_audio = ica.fit_transform(audio_data.reshape(-1, num_channels)).T ``` 4. 将分离后的信号保存为 WAV 文件。 ```python # 将数据类型转换为 int16 separated_audio_int = (separated_audio * 32768.0).astype(np.int16) # 创建 WAV 文件对象 with wave.open('separated.wav', mode='wb') as wav_file: # 设置声道数、采样宽度和采样率 wav_file.setnchannels(num_channels) wav_file.setsampwidth(sample_width) wav_file.setframerate(resampled_rate) # 将分离后的数据写入 WAV 文件 wav_file.writeframes(separated_audio_int.T.tobytes()) ``` 以上是基本的声音分离流程,具体实现还需要根据实际情况进行调整和优化。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值