学着提取加密mp4视频的时候,用到了mp4的一些知识,主要有box结构和sample的offset计算。
mp4的box结构
mp4 文件由 box 构成,box 有 basic box 和 full box 两种:
- basic box
box_size (not 0 and 1) | box_type | box_data |
---|---|---|
uint32 | char[4] | box_size - 8 |
box_size (1) | box_type | largesize | box_data |
---|---|---|---|
uint32 | char[4] | uint64 | largesize - 16 |
box_size (0) | box_type | box_data |
---|---|---|
uint32 | char[4] | box extends to end of file |
- full box
basic_box_header | version | flag | box_data |
---|---|---|---|
8 or 16 bytes | uint8 | uint24 | same like basic box |
box的type
box可以嵌套,顶层的box有ftyp、moov、mdat、free、uuid等,其中ftyp、moov和mdat是一个mp4文件所必须的box,本文只介绍我用到的box。
一般ftyp是第一个box,mdat是存储实际音视频数据的box,moov描述了音视频数据的大小和位置。
mp4的trak box
trak是moov的子box,一般mp4文件有两个trak,一个是音频trak,一个是视频trak。
mp4中的sample和chunk
sample是mp4中存储音视频的最小单位,chunk是由sample组成的。它们相关的box有三个,都属于trak的子box:stsc、stsz、stco,它们三个都是full box类型。
- stsz
aligned(8) class SampleSizeBox extends FullBox(‘stsz’, version = 0, 0) {
unsigned int(32) sample_size;
unsigned int(32) sample_count;
if (sample_size==0) {
//if sample_size>0 then each sample's size is sample_size
for<