以下内容为个人自己整理的,不定时更新!
1
我们能够听见的音频信号的频率范围大约是20Hz-2OkHz,其中语音大约分布在300Hz-4kHz之内
男性语音为180Hz,女性歌声为600Hz,钢琴上 C调至A调间为440Hz,电视机发出人所能听到的声音是17kHz,人耳能够感知的最高声音频率为20kHz
2、常用音频格式
WAVE、MIDI、MP3、RM常见音频格式简介
WAVE--WINDOWS系统最基本音频格式---*.wav
1、占用巨大硬盘空间,音质最好,支持音乐与语音
2、通常采样使用44KHZ采样/秒,16位/采样,立体声,双声道,CD音质
3、一分钟音乐占用大约10M硬盘空间,56K调制解调器需要30分钟才能完成网络传送
MIDI--电子合成音乐---*.mid
1、与WAVE格式截然不同,只有音乐,没有语音
2、使用音色库回放,有软硬波表之分,
3、十分节省磁盘空间,但是音质回放对声卡依赖较大
4、无法使用TotalRecorder录制mid音乐
5、可以使用Wingroove软波表或其它软件转为wave
MP3--最流行音频压缩格式---*.mp3
1、节省硬盘空间,有损压缩,无法复原
2、音质与不同压缩编码软件有关
3、音乐与语音,可以使用各种采样比率
RM--网络流媒体压缩格式---*.rm/*.ra
1、节省磁盘空间,有损压缩,无法复原
2、在目前比较窄的网络带宽下,与Real Server服务器配合,使用Real Player在客户端
比较流畅地播放音视频媒体
其它还有:
1、微软的WMA编码--*.wma
2、微软的ASF流媒体编码--*.asf
3、Yamaha的VQF编码--*.vqf
3 大小计算
存储量=(采样频率*采样数位)/8(字节数)
若采用双声道录音,存储量再增加一倍。例如,数字激光唱盘(CD-DA,红皮书标准)的
标准采样频率为44.lkHz,采样数位为16位,立体声,可以几乎无失真地播出频率高达2
2kHz的声音,这也是人类所能听到的最高频率声音。激光唱盘一分钟音乐需要的存储量
为:
44.1*1000*l6*2*60/8=10,584,000(字节)=10.584Mbytes wav 未压缩
所以比特率(数码率)就是44.1*1000*l6*2 = 1411.2 Kbps
到目前为止,音频信号经压缩后的数码率降低到32至256kbit/s,语音可以低至8kbit/s以下。
4
采样率:每秒采集数据的次数
采样精度:每次采集数据的位数
通道数:存在几路音频
比特率:针对编码格式,表示压缩编码后每秒的音频数据量大小。
音频的帧的概念没有视频帧那么清晰,几乎所有视频编码格式都可以简单的认为一帧就是编码后的一副图像。
但音频帧跟编码格式相关,它是各个编码标准自己实现的。因为如果以PCM(未经编码的音频数据)来说,它根本就不需要帧的概念