### 出现的问题:
‘lengths‘ argument should be a 1D CPU int64 tensor, but got 1D cuda:0 Long tensor
解决办法:
packed = pack_padded_sequence(embed_src, src_length, batch_first=True)
改为
packed = pack_padded_sequence(embed_src, src_length.cup(), batch_first=True)
参考
https://github.com/joeynmt/joeynmt/pull/119/commits/ef1b0f081fedfcf83ce39cd2f27dcc33d3cbb2d1
同一问题,已解决
### 出现的问题:
Python音频转成numpy数组:numpy.frombuffer报错ValueError: buffer size must be a multiple of element size
使用背景:导入音频信号,下面代码段最后一句报错
import wave
import numpy as np
f = wave.open(wav_path)
params = f.getparams()
nchannels, sampwidth, framerate, nframes = params[:4]
# 声道数; 量化位数(byte); 采样频率; 采样点数
str_audio = f.readframes(nframes)
f.close()
audio = np.frombuffer(str_data, dtype=np.short)
问题解决:最后一句dtype的参数改成与自己的声音信号相一致
查看sampwidth这一参数,量化位数(sampwidth)就是记录声波每次采样所需的位数,一般有16,24,32位:
- 数据量(总b) = 采样频率(Hz) x 量化位数(bit) x 时间(s) x 声道数(个)
- 数据量(总B) = 采样频率(Hz) x 量化位数(bit) x 时间(s) x 声道数(个) / 8
如果音频的量化位数为24bit,如何读取?
可以使用wavio包,直接读取成numpy数组
import wavio
audio = wavio.read(wav_path)
附上wavio的github链接: