如何从wav数据判断音量的高低?
https://www.zhihu.com/question/29157624
作者:舒书
链接:https://www.zhihu.com/question/29157624/answer/46669197
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
这问题就听不懂,问题描述也是错的。振幅是声音强度,就是大小,波形图横坐标是时间,纵坐标是强度。你问我怎么判断高低,我问你NBA和CBA全明星谁炒的菜好吃?
说话声音高低是靠基频来看,高的就“尖”,低的就“沉”。通常女性比男性,小孩儿比大人声音“尖”。你说的什么什么数据叫采样率,以下是百度百科,有点啰嗦,如果我来解释,音频的采样率就像视频的帧大小一样,越大越清楚,但你一个12寸显示器,要那么大干嘛?“WAV”是编码方式,就像视频的“AVI”。
你问我如何从“AVI”的帧大小来判断一帧中画面中出现人物的多少?我回答你“MP4”表示被冷落。
通俗的讲采样频率是指计算机每秒钟采集多少个声音样本,是描述声音文件的音质、音调,衡量声卡、声音文件的质量标准。采样频率越高,即采样的间隔时间越短,则在单位时间内计算机得到的声音样本数据就越多,对声音波形的表示也越精确。采样频率与声音频率之间有一定的关系,根据奈奎斯特理论,只有采样频率高于声音信号最高频率的两倍时,才能把数字信号表示的声音还原成为原来的声音。这就是说采样频率是衡量声卡采集、记录和还原声音文件的质量标准。
在数字音频领域,常用的采样率有:
8,000 Hz - 电话所用采样率, 对于人的说话已经足够
11,025 Hz
22,050 Hz - 无线电广播所用采样率
32,000 Hz - miniDV 数码视频 camcorder、DAT (LP mode)所用采样率
总之当前声卡常用的采样频率一般为44.1KHz(每秒采集声音样本44.1千次)11KHz、22KHz、和48KHz。11KHz的采样率获得的声音称为电话音质,基本上能让你分辨出通话人的声音;22KHz称为广播音质;44.1KHz称为CD音质。采样频率越高,获得的声音文件质量越好,占用磁(光)盘的空间也就越大。一首CD音质的歌曲会占去45M左右的盘空间。
题主可能是以为音量高低是由文件决定的。
错了。
在电脑上他只跟你开多大有关。从-100db到0db。
音量大小由放大器决定。
文件只负责记录声音。在相同音量下,大致可以理解为波形越高的“声音越大”。
当然这个理解是不严谨的。
严谨的我也不知道怎么说╮(╯▽╰)╭