客户端的处理流程
音视频采集
音频数据的流转
声音
- 声音是由物体振动产生的
- 它可以通过空气、固体、液体等进行传输
- 振动耳膜
人类听觉范围是20HZ~20kHZ
声音的三要素
- 音调:音频的快慢 男生<女生<儿童(频率越高越悦耳)
- 音量:振动的幅度
- 音色:谐波
模数转换
对声音进行量化采样
量化后数字信息
正常每次采样48000次
十进制转二进制
二进制方波
PCM与WAV
音频原始数据格式
- PCM
- WAV
量化的基本概念
- 采样大小:一个采样用多少bit存放。常用的是16bit
- 采样率:采样频率8k、16k、32k、44.1k、48k
- 声道数:单声道、双声道、多声道
码率计算
P
C
M
码
率
=
采
样
率
×
采
样
大
小
×
声
道
数
PCM码率=采样率×采样大小×声道数
PCM码率=采样率×采样大小×声道数
例如:采样率为44.1KHZ,采样大小为16bit,双声道的PCM编码的WAV文件,它的码率为44.1K×16×2=1411.2kb/s。
WAV Header
-
RIFF块
包含块的描述符,块的大小(chunk size),WAVE协议描述
描述符告知该数据块为WAV格式,它有两个子块:“fmt”(格式块)和“data”(数据块)。 -
格式块
包换块的描述符,块的大小,数据格式(Audio Format),声道数(NumChannels),采样率(SampleRate),码率(ByteRate),块的对齐(BlockAligin) -
数据块
包换块的描述符,块的大小,采样数据1(sample 1).……采样数据N(sample N)