最主要的原因就是 数据类型 的问题。
我们想获取麦克风声音大小的时候可以使用RMS指标来进行判断。通过麦克风获取声音的时候,输入的一般是一个 bytes 类型的数据,需要先通过 np.frombuffer(data, np.int16) 进行数据类型的转化,然后手动实现RMS;或者直接通过 audioop.rms(data, 2) 获取RMS值,但是这样做后会发现上述两种方法的输出是不一样的。
import audioop
import numpy as np
data = b'abcdefgh'
temp = audioop.rms(data, 2)
data1 = np.frombuffer(data, np.int16)
temp1 = np.sqrt((data1 * data1).sum() / (1. * len(data1)))
print(temp, temp1)
上述代码的输出为 25962 80.1311425102625,通过代码可以得知 data1的元素类型为 np.int16,我们进行平方才操作后,会造成数据大小溢出,所以我们需要将 data1 的类型进行进行转化。
import audioop
import numpy as np
data = b'abcdefgh'
temp = audioop.rms(data, 2)
data1 = np.frombuffer(data, np.int16)
temp1 = np.sqrt((data1 * data1).sum() / (1. * len(data1)))
data2 = np.frombuffer(data, np.int16).astype(float)
temp2 = np.sqrt((data2 * data2).sum() / len(data2))
print(temp, temp1, temp2)
输出为:25962 80.1311425102625 25962.36085181777,现在答案就一致了。
其他注意事项:
两个列表直接相乘不会主动报数据大小溢出的 RuntimeWarning,但是使用每个元素相乘就会报警告,感觉这个错误还是蛮隐蔽的。
import audioop
import numpy as np
data = b'abcdefgh'
temp = audioop.rms(data, 2)
data1 = np.frombuffer(data, np.int16)
print(data1 * data1)
print(data1[0])
print(data1[0] * data1[0])
输出:
[ 26817 32329 -23591 -9871]
25185
26817
D:\code_python\test\test11.py:10: RuntimeWarning: overflow encountered in short_scalars
print(data1[0] * data1[0])
Process finished with exit code 0
参考链接:https://stackoverflow.com/questions/9763471/audioop-rms-why-does-it-differ-from-normal-rms