【PYTHON】在Python中立体声到单声道wav

本文讨论了在将立体声音频转换为单声道时遇到的问题。错误的方法是通过平均左右声道的样本值来创建新的单声道数组,导致声音质量下降。解决方法在于将原始数据转换为浮点格式,并使用向量化操作(如numpy的切片或sum函数)来平均声道,从而提高效率并避免声音失真。
摘要由CSDN通过智能技术生成

使用wavefile.read()载入一个wav,它提供了samplerateaudiodata

这个音讯资料如果是立体声则储存为多维阵列,比如

audiodata[[left right]
          [left right]
          ...
          [left right]]

错误方法

用这个方法建立一个新的单声道音讯资料阵列,方法是(右+左)/2

def stereoToMono(audiodata)
    newaudiodata = []

    for i in range(len(audiodata)):
        d = (audiodata[i][0] + audiodata[i][1])/2
        newaudiodata.append(d)

    return np.array(newaudiodata, dtype='int16')

然后用

wavfile.write(newfilename, sr, newaudiodata)

这产生了一个单声道的wav档案,但是声音很脏,而且一直在点选等。做错什么了?

解决办法

首先,什么是audiodata的资料型别?假设它是某种固定宽度的整数格式,因此会溢位。

如果在处理前将其转换为浮点格式,则可以正常工作:

audiodata = audiodata.astype(float)

第二,不要一个元素一个元素地编写您的python程式码;向量化它:

d = (audiodata[:,0] + audiodata[:,1]) / 2

或者更好

d = audiodata.sum(axis=1) / 2

这将大大快于您编写的元素回圈。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值