目录
1 定义&作用
2 整体介绍
2.1 FLV Header
2.2 FLV Body
2.2.1 Tag header:
2.2.2 每种类型的Tag Data详解
1) Audio Tag Data
2) Video Tag Data
3) Script Tag Data
正文
系列文章:
rtmp 分析参见:rtmp 看一篇就够了草稿_fdsafwagdagadg6576的专栏-CSDN博客.
H264解析:https://blog.csdn.net/fdsafwagdagadg6576/article/details/108561061
一个FLV文件由一个头部信息,一个script Tag,以及若干个video Tag和audio Tag组成.
(上图的scrtip data应该移到Previous tagsize(N)之上)
本文主要内容来自:FLV格式详解 https://blog.csdn.net/weixin_42462202/article/details/88661883上文一层一层介绍了FLV格式. 本文对其内容增加了思维导图,增加了comments并补充了实例.
1 定义:
FLV是一种文件格式.类似的还有Mp4.
作用:
将H264,Aac裸流封装成文件格式.
为什么要对裸流做文件格式封装?即FLV文件和原始文件区别?
1 文件播放. 原始文件播放读一帧解析一帧. 没有整体时长,不能拖拽,倍速播放等音视频控制了.
FLV文件因为有FLV tag保存音视频信息。所以可以显示视频时长,播放进度,拖拽,倍速播放等.
2 是协议支持,rtmp协议要求,数据必须Flv格式. rtc协议数据才是裸流。
关键字:tag
2 整体介绍:
Flv由 “Flv header” 和 “Flv Body”组成。
Flv Body由一系列的Tag组成,每个Tag又有一个preTagSize字段,标记着前面一个Tag的大小
2.1 Flv Header
Header长度一般都是固定的9个字节:
2.2 Flv Body
Flv Body由一个一个Tag组成,每个Tag都有一个preTagSize字段,标记着前面一个Tag的大小。
Tag有三种类型,Audio Tag(音频Tag),Video Tag(视频Tag),script Tag(又称Metadata Tag).
每个Tag由“Tag Header”和“Tag Data”组成.Tag=Tag Header+Tag Data.
对于不同类型的Tag,“Tag Header”的格式都是相同的,“Tag Body”的格式就不一样了。
2.2.1 Tag header:
图片说明:3种tag的tag header格式一样,只有Tag type 域的值不同,分别是08(音频),09(视频),12(script data).
header中各个域都很主要,包含 av type,ts ,datasize 等,这些域可以使视频能够显示时间,拖拽,倍速播放等.
Notes:注意Flv header和Flv tag header是不同的.
下面这张图归纳一下上面讲的内容,看完后对flv应该有个总体的了解了
一个FLV文件由一个头部信息,一个script Tag,以及若干个video Tag和audio Tag组成。
图片说明:tag之间是previous tag size
2.2.2 每种类型的Tag Data详解
Flv有三种tag:“Audio Tag Data”、“Video Tag Data”、“Script Tag Data”
1) Audio Tag Data
如果SoundFormat=10,那么音频数据就是AAC AUDIO DATA。
notes:音频参数只有一个字节
- AAC AUDIO DATA 格式如下:
2)、Video Tag Data
a) 视频参数:
对于H.264数据来说,CodecID = 7。
当CodecID = 7时,视频数据就是AVCVIDEOPACKET格式。
b) 视频数据:
下面讲解一下AVCVIDEOPACKET。
- 如果 AVCPacketType = 0,那么Data就是AVCDecoderConfigurationRecord格式。
以下是AVCDecoderConfigurationRecord的结构
notes: SPS/PPS 说明
- 如果 AVCPacketType = 1,那么Data结构就简单多了。
notes: 外层的tag header决定了audio 还是video .视频参数决定是I,P还是B帧.
notes: FLV封装的h264 没有start code 0x00 00 00 01
c) 实例分析:
i)Tag Header:
Type:09(Tag的类型,包括音频(0x08)、视频(0x09)、script data(0x12))
Datasize:00 00 2e(Tag Data 部分的大小)
Timestamp:00 00 00(时间戳)
Timestamp_ex:00(时间戳的扩展部分)
StreamID:00 00 00(总是0)
ii) Tag data:
FrameType | CodecID:17(keyframe | AVC)(视频tag的参数)
因为CodecID=7,所以视频数据就是AVCVIDEOPACKET格式
- AVCVIDEOPACKET:
AVCPaketType:00(ACVPacket的类型,0: AVC sequence header;1: AVC NALU;2: AVC end of sequence)
CompositionTime:00 00 00
因为ACVPaketType==0,所以Data=AVCDecoderConfigurationRecord
- AVCDecoderConfigurationRecord:
configurationVersion:01
AVCProfileIndication:64
profile_compatibility:00
AVCLevelIndication:1e
lengthSizeMinusOne:ff (NALUSize的长度,计算方法为:1 + (lengthSizeMinusOne & 3)=4)
numOfSequenceParameterSets:e1(低五位为SPS的个数,计算方法为:numOfSequenceParameterSets & 0x1F=1)
sequenceParameterSetLength:00 18(SPS的长度,24)
sequenceParameterSetNALUnits:67 64 00 1e ac d9 40 a0 33 b0 11 00 00 03 02 47 00 00 6d 34 0f 16 2d 96(SPS)
numOfPictureParameterSets:01(PPS的个数)
pictureParameterSetLength:00 06(PPS的长度)
pictureParameterSetNALUnits:68 eb e3 cb 22 c0(PPS)
previousTagSize:00 00 00 39
3)、Script Tag Data
该类型Tag又通常被称为MetadataTag,会放一些关于FLV视频和音频的元数据信息如:duration、width、height等。通常该类型Tag会跟在FileHeader后面作为第一个Tag出现,而且只有一个。
notes:用amf语法实现metadata数据key-value存储.amf 数据的都是 "类型 + [长度] + 值" 的形式。
结构如下图所示
AMF包:第一个字节表示AMF包的类型
第一个AMF包:
第一个字节一般为0x02,表示字符串,第2-3个字节表示字符串的长度,一般为0x000A,后面跟的就是字符串,一般为"onMetaData"。
第二AMF包:
第一个字节为0x08,表示数组,第2-5个字节表示数组元素个数,后面跟着就是数组的元素,格式为:元素名长度(UI16) + 元素名(UI8[n]) + 元素的值(double),最后以“009”结尾。
常见的数组元素
上面的论述不能完全将script tag data说清楚,请同时参考下面的补充材料.
补充: Nginx-rtmp之 AMF0 的处理 Nginx-rtmp之 AMF0 的处理 - 季末的天堂 - 博客园
这篇blog:有具体的抓包实例分析. 对script tag data论述更详细.
notes: amf0和amf3有什么区别?:通常都是amf0, amf3是它的特殊补充.
参见 amf0 amf3 的区别_李云汉的博客-CSDN博客
总结:
图片说明:此图没有对script tag,video tag,audio tag做区分和具体介绍.
其他参考:多媒体文件格式之FLV: https://www.cnblogs.com/jimodetiantang/p/8992425.html
(有audio,video各个域的详细说明)