FLV是一个二进制文件,由文件头(FLV header)和很多tag组成。tag又可以分成三类:audio,video,script,分别代表音频流,视频流,脚本流(关键字或者文件信息之类)。
FLV Header
一般比较简单,包括文件类型之类的全局信息
文件类型 | 3bytes | 总是FLV(0x46 0x4C 0x56),否则... |
版本 | 1byte | 一般是0x01,表示FLV version 1 |
流信息 | 1byte | 倒数第一bit是1表示有视频,倒数第三bit是1表示有音频,其他都应该是0(有些软件如flvtool2可能造成倒数第四bit是1,不过也没发现有什么不对) |
header长度 | 4bytes | 整个文件头的长度,一般是9(3+1+1+4),有时候后面还有些别的信息,就不是9了 |
FLV Body
FLV body就是由很多tag组成的,一个tag包括下列信息:
previoustagsize | 4bytes | 前一个tag的长度,第一个tag就是0 |
tag类型 | 1byte | 三类:
|
数据区长度 | 3bytes | |
时间戳 | 3bytes | 单位毫秒,如果是脚本tag就是0 |
扩展时间戳 | 1byte | 作为时间戳的高位 |
streamsID | 3bytes | 总是0(不知道干啥用) |
数据区 | If TagType == 8 AUDIODATA If TagType == 9 VIDEODATA If TagType == 18 SCRIPTDATAOBJECT
|
根据不同的tag类型就有不同的数据区
Audio tag 数据区
audio信息 | 1byte | 前四位bits表示音频格式:
下面两位bits表示samplerate:
下面一位bit表示每个采样的长度:
下面一位bit表示类型:
|
audio数据区 | 不定 |
if SoundFormat == 10 AACAUDIODATA else Sound data—varies by format
|
AACAUDIODATA
AACPacketType | 1byte |
0: AAC sequence header 1: AAC raw
|
AACAUDIODATA数据区 | 不定 |
iif AACPacketType == 0 AudioSpecificConfig else if AACPacketType == 1 Raw AAC frame data
|
video tag 数据区
video信息 | 1byte | 前四位bits表示类型:
后四位bits表示编码器id:
|
video数据区 | 不定 |
If CodecID == 2 H263VIDEOPACKET If CodecID == 3 SCREENVIDEOPACKET If CodecID == 4 VP6FLVVIDEOPACKET If CodecID == 5 VP6FLVALPHAVIDEOPACKET If CodecID == 6 SCREENV2VIDEOPACKET if CodecID == 7 AVCVIDEOPACKET
|
H263VIDEOPACKET
H263VIDEOPACKET数据结构:
PictureStartCode UB[17] 和H.263 5.1.1相似
0000 0000 0000 0000 1
Version UB[5] 视频格式版本
Flash Player 6 supports 0 and 1
TemporalReference UB[8] 察看 H.263 5.1.2
PictureSize UB[3] 图像尺寸:
000: custom, 1 byte
001: custom, 2 bytes
010: CIF (352x288)
011: QCIF (176x144)
100: SQCIF (128x96)
101: 320x240
110: 160x120
111: 保留
CustomWidth If PictureSize = 000 UB[8]
If PictureSize = 001 UB[16]
否则不存在
注意:UB[16]不一样UI16,这里不是字节交换的
单位是像素
CustomHeight If PictureSize = 000 UB[8]
AVCVIDEOPACKET
AVCPacketType | 1byte |
0: AVC sequence header 1: AVC NALU 2: AVC end of sequence (lower level NALU sequence ender is not required or supported)
|
CompositionTime | 3byte |
if AVCPacketType == 1 Composition time offset else 0
|
Data | 不定 |
if AVCPacketType == 0 AVCDecoderConfigurationRecord else if AVCPacketType == 1 One or more NALUs (can be individual slices per FLV packets; that is, full frames are not strictly required) else if AVCPacketType == 2 Empty
|
script tag 数据区
来两张图片