【转载】MP4文件数据结构以及提取部分信息的代码

3 篇文章 0 订阅

原文链接:http://bbs.pfan.cn/post/413874.html

MP4文件数据结构以及提取部分信息的代码

一、名词解释

  1. track:音轨,它是样本的集合,对于媒体数据来说,音轨表示一个视频或音频序列。
  2. hint track:索引音轨,这个特殊的音轨并不包含媒体数据,而是包含了一些将其他数据音轨打包成流媒体的指示信息。如果文件只是本地播放,可以忽略索引音轨,因为它们只与流媒体有关系。本文不讨论索引音轨的内容,只关注包含媒体数据的本地MP4文件。
  3. sample:样本,对于非索引音轨来说,视频样本即为一帧视频,或一组连续视频帧;音频样本即为一段连续的压缩音频。对于索引音轨来说,样本定义一个或多个流媒体包的格式。
  4. sample table:样本表。指明样本时序和物理布局的表格。
  5. chunk:块。一个音轨中的几个样本组成的单元。
  6. ticks:瞬时,是MP4 文件媒体的最小时间单元。

二、概述

MP4 文件中的媒体描述与媒体数据是分开的,并且媒体数据的组织也很自由,不一定要按照时间顺序排列,甚至媒体数据可以直接引用其他文件,这样,一部电影就可以由一个媒体数据库中的多个不同文件组成,而不用把它们全部拷贝到一个文件中。同时,MP4也支持流媒体。

MP4文件由许多包(box)组成。包可以嵌套,嵌套的包称为集装包(container box)。

由于嵌套的出现,又形成了层,最顶级的层为文件层。

包有很多类型(但并不都是必需的),类型名称由4个小写的Ascii字符组成。包类型是预先定义好的,有固定的意义。MP4 文件层的常用包类型见表1。

MP4 文件中有关长度和大小的数据,其字节序为高位在前的存储方式。

表1 MP4文件层常用的包类型

名称描述
ftyp描述的文件的版本、兼容协议等信息
moov本文件中所有媒体数据的宏观描述信息
mdat实际媒体数据。我们最终解码播放的数据都在这里面
moof电影片断描述信息,在流文件中是重中之重
mfra媒体索引,一般在文件末尾,可通过查询直接定位所需时间点的媒体数据
pdin下载信息
free自由空间
skip自由空间
meta元数据
meca附加元数据集合
uuid用户扩展类型

说明:
1. 一个MP4文件必有且只有一个”ftyp”类型的包,它在文件的开始位置,也是MP4文件格式的标志。
2. 一个MP4文件必有且只有一个”moov”类型的包,这是一种集装包类型,子包包含了媒体的属性数据(metadata)信息。
3. mdat也是一种集装包类型,包含着MP4文件的媒体数据,媒体数据的属性数据由metadata进行描述。当 MP4文件的媒体数据不是全部引用其他文件时,这种包是必有包,还可以有多个。当媒体数据全部引用其他文件时,就不需要这种包了。
4. moof类型包是流文件中的必有包,但本地MP4文件不需要。

三、包的数据结构

包由包头(header)和包体(body)组成,其中包头指明包的大小和类型,包体根据包类型有不同的意义和格式。

集装包也由包头和包体组成,其包体由若干子包组成,第一个子包称作头部包。除了头部包外,其它子包也可以是集装包。

下表是包头的结构。

表2 包头的结构

名称数据类型占用字节说明
sizeUINT324包头和包体的总大小
type字符型4包类型的Ascii码字符
largesizeUINT648如果size=1,才有此项

说明:
1. 除了mdat类型的包以外,其它包都只有前两项,没有largesize这一项。
2. mdat类型的包才可能会有largesize。如果size=1,说明包很大,超过了uint32的最大值,这时就会有largesize项,包大小就由该该项值决定,如果size=0,表示该包为文件的最后一个包,文件结尾即为该包结尾。

四、ftyp包(File Type Box,文件类型包)

该包在文件的最前面,包含着该MP4文件版本、兼容协议等信息。
文件类型包的包体结构见表3。
表3 ftyp包的包体结构

名称数据类型占用字节说明
major brand字符4主版本
minor versionUINT324次版本
compatible brands数组不定

说明:
1. compatible brands是字符型数组,以4字符为单位元素,描述兼容协议。

五、moov包(Movie Box,影像包)

该包紧随在ftyp包后面,它包含了文件媒体的属性数据(metadata)。moov是集装包,具体内容由子包诠释。

一般情况下,moov包中除了包头外,它的包体由1个mvhd子包和若干个trak子包构成。mvhd为头部包,trak是音轨包。音轨包也是集装包,其中的一系列子包描述了每个媒体轨道的具体信息。
下面分别解析。

  1. 影像包的mvhd(头部包)
    mvhd中记录了创建时间、修改时间、时间度量标尺、可播放时长等信息。

表4 影像包mvhd的结构

名称字节数意义
box size4包大小,共108(&H6C)字节
box type4包类型,”mvhd”字符
version1版本,一般为0
flags3标记,一般为0
creation time4创建时间(相对于UTC时间1904-01-01零时的秒数)
modification time4修改时间(同上)
time scale4时间刻度,设置文件媒体每秒=多少个瞬时
duration4持续时间,设置该音轨共有多少个瞬时
rate4播放速率
volume2音量
reserved10保留位
matrix36视频变换矩阵
pre-defined24预定义(用途不明)
next track id4下一条音轨的ID号

说明:
1. 用duration和time scale可以计算音轨时长:音轨时长(秒)=duration÷time scale
例如:音频音轨的time scale = 8000, duration = 560128,时长=560128÷8000=70.016秒
视频音轨的time scale = 600, duration = 42000,时长=42000÷600=70秒
2. rate是[16.16] 格式,高16位和低16位分别为小数的整数部分和小数部分,1.0表示正常向前播放
3. volume是[8.8] 格式。如果是音频音轨,1.0表示最大音量;如果是视频音轨,该项值=0
4. next track id指向的音轨其实是不存在的,此ID号是在本moov包中最大的音轨ID号再加上1。

查看原文

博客模板如下

本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:

  1. Markdown和扩展Markdown简洁的语法**
    • 代码块高亮
    • 图片链接和图片上传
    • LaTex数学公式
    • UML序列图和流程图
    • 离线写博客
    • 导入导出Markdown文件
    • 丰富的快捷键

快捷键

  • 加粗 Ctrl + B
  • 斜体 Ctrl + I
  • 引用 Ctrl + Q
  • 插入链接 Ctrl + L
  • 插入代码 Ctrl + K
  • 插入图片 Ctrl + G
  • 提升标题 Ctrl + H
  • 有序列表 Ctrl + O
  • 无序列表 Ctrl + U
  • 横线 Ctrl + R
  • 撤销 Ctrl + Z
  • 重做 Ctrl + Y

Markdown及扩展

Markdown 是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档,然后转换成格式丰富的HTML页面。 —— [ 维基百科 ]

使用简单的符号标识不同的标题,将某些文字标记为粗体或者斜体,创建一个链接等,详细语法参考帮助?。

本编辑器支持 Markdown Extra ,  扩展了很多好用的功能。具体请参考Github.

表格

Markdown Extra 表格语法:

项目价格
Computer$1600
Phone$12
Pipe$1

可以使用冒号来定义对齐方式:

项目价格数量
Computer1600 元5
Phone12 元12
Pipe1 元234

定义列表

Markdown Extra 定义列表语法: 项目1 项目2
定义 A
定义 B
项目3
定义 C

定义 D

定义D内容

代码块

代码块语法遵循标准markdown代码,例如:

@requires_authorization
def somefunc(param1='', param2=0):
    '''A docstring'''
    if param1 > param2: # interesting
        print 'Greater'
    return (param2 - param1 + 1) or None
class SomeClass:
    pass
>>> message = '''interpreter
... prompt'''

脚注

生成一个脚注1.

目录

[TOC]来生成目录:

数学公式

使用MathJax渲染LaTex 数学公式,详见math.stackexchange.com.

  • 行内公式,数学公式为: Γ(n)=(n1)!nN
  • 块级公式:

x=b±b24ac2a

更多LaTex语法请参考 这儿.

UML 图:

可以渲染序列图:

Created with Raphaël 2.1.0 张三 张三 李四 李四 嘿,小四儿, 写博客了没? 李四愣了一下,说: 忙得吐血,哪有时间写。

或者流程图:

Created with Raphaël 2.1.0 开始 我的操作 确认? 结束 yes no
  • 关于 序列图 语法,参考 这儿,
  • 关于 流程图 语法,参考 这儿.

离线写博客

即使用户在没有网络的情况下,也可以通过本编辑器离线写博客(直接在曾经使用过的浏览器中输入write.blog.csdn.net/mdeditor即可。Markdown编辑器使用浏览器离线存储将内容保存在本地。

用户写博客的过程中,内容实时保存在浏览器缓存中,在用户关闭浏览器或者其它异常情况下,内容不会丢失。用户再次打开浏览器时,会显示上次用户正在编辑的没有发表的内容。

博客发表后,本地缓存将被删除。 

用户可以选择 把正在写的博客保存到服务器草稿箱,即使换浏览器或者清除缓存,内容也不会丢失。

注意:虽然浏览器存储大部分时候都比较可靠,但为了您的数据安全,在联网后,请务必及时发表或者保存到服务器草稿箱

浏览器兼容

  1. 目前,本编辑器对Chrome浏览器支持最为完整。建议大家使用较新版本的Chrome。
  2. IE9以下不支持
  3. IE9,10,11存在以下问题
    1. 不支持离线功能
    2. IE9不支持文件导入导出
    3. IE10不支持拖拽文件导入


  1. 这里是 脚注内容.
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值