MP4格式标准介绍

  • MP4文件由许多个box与FullBox组成,无一例外。
  • 每个box由header和data两部分组成。
  •  FullBox则是box的扩展,以box结构为基础,在header中增加8位的version标志和24位的flags标志。
  •  header包含了整个box的长度大小(size)和类型(type),类型是一个典型的4字符的标签,一般被称为FourCC。当size等于0时,代表这个box是文件的最后一个box;当size等于1时,说明box长度需要更多的位来描述,在后面会定义一个64位的largesize来描述box的长度。
MP4 box基本结构

MP4扩展box
MP4 box嵌套box

box结构如下:

Root Box (ftyp)
│
├── moov (Movie Box)
│   ├── mvhd (Movie Header Box)
│   ├── trak (Track Box)
│   │   ├── tkhd (Track Header Box)
│   │   ├── mdia (Media Box)
│   │   │   ├── mdhd (Media Header Box)
│   │   │   ├── hdlr (Handler Reference Box)
│   │   │   ├── minf (Media Information Box)
│   │   │   │   ├── vmhd (Video Media Header Box)
│   │   │   │   ├── smhd (Sound Media Header Box)
│   │   │   │   ├── dinf (Data Information Box)
│   │   │   │   ├── stbl (Sample Table Box)
│   │   │   │   │   ├── stsd (Sample Description Box)
│   │   │   │   │   ├── stts (Time-to-Sample Box)
│   │   │   │   │   ├── stsz (Sample Size Box)
│   │   │   │   │   ├── stsc (Sample-to-Chunk Box)
│   │   │   │   │   ├── stco (Chunk Offset Box)
│   │   │   │   │   ├── stss (Sync Sample Box)
│   ├── udta (User Data Box)
│   ├── iods (Image Decode Session Box)
│
├── mdat (Media Data Box)
│
└── free (Free Box)  // 可选

 box说明如下:

ftyp (File Type Box):文件的基础信息,包含文件格式类型。
moov (Movie Box):包含了有关整个媒体文件的元数据。它是 mdat 之外最重要的部分。
mvhd (Movie Header Box):描述整个电影文件的基本信息(如时间尺度、持续时间等)。
trak (Track Box):每个轨道(音频、视频等)的描述。
tkhd (Track Header Box):该轨道的基本信息(如尺寸、持续时间等)。
mdia (Media Box):描述轨道中的媒体数据。
mdhd (Media Header Box):该媒体的基本信息。
hdlr (Handler Reference Box):媒体处理器信息(例如视频或音频处理器)。
minf (Media Information Box):媒体信息,包含了如视频格式或音频格式的详细数据。
stbl (Sample Table Box):描述样本表结构,包含了用于媒体播放的数据。
mdat (Media Data Box):包含实际的媒体数据(音频、视频等)。
udta (User Data Box):存储用户自定义的数据或附加信息。
free (Free Box):保留或未使用的空间。

1. moov说明

moov定义了MP4文件的元数据信息。

moov本质上是其他box的一个容器,这些box组合在一起描述了多媒体的内容。

如果希望MP4文件被快速打开,则需要将moov存放在mdat的前面,如果放在后面,需要将MP4文件下载完成后才可以进行播放。

 moov中最为常见的是mvhd,它定义了整个多媒体文件的timescale、duration等显示特性。而trak中定义了多媒体文件中的一个track的信息,track指的是多媒体文件中可以独立操作的媒体单位,例如一个声道是一个track,一个视频流也是一个track。

2. mvhd说明

mvhd box在moov box里面,包含了与整个播放展示相关的元数据。诸如文件的创建和修改时间等信息,它告诉我们视频播放器总时长、time scale、播放速度和初始音量。

3. trak说明

trak定义了媒体文件中一个track(轨道)的信息。一个媒体文件可以包含多个track,每个track都是独立的,有自己的时间和空间占用的信息。每个trak容器都有与它关联的媒体容器描述信息。

4. tkhd说明

tkhd放在trak box里,每个track只能有一个tkhd。它是强制性的,包含描述单个轨道的特性的元数据。

5. mdia说明

mdia box包含了有关媒体轨道(如音频、视频等)的详细信息,对应一个轨道中的媒体内容。通常包含以下几个子 Box:

  • 媒体头容器:Media Header box(mdhd)
  • 句柄参考容器:Handler Reference box(hdlr)
  • 媒体信息容器:Media Information box(minf) 
  • 用户数据容器:User Data box(udta)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值