import torchaudio
import torch
wav,sr = torchaudio.load('iter1-0-1.wav') #原音频 32bit 16k采样
wav_int16 = wav*32767
wav_int16 = wav_int16.to(torch.int16)
torchaudio.save("1.wav",wav_int16,16000)
原理:
wav * 32767:将浮点数音频数据乘以一个常数32767,这个常数是16位整数的最大值,即2^15-1。这个操作的目的是将浮点数音频数据的范围从[-1, 1]映射到[-32768, 32767],这样就可以将其转换为16位整数了。