MP4容器里的时间戳详解

原创于 2025-12-20 10:23:50 发布 · 205 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#音视频

“校正后的结论”

在 MP4 的 stbl 里：
每个 sample“逻辑上”都有时间戳，
但“物理上”并不是逐 sample 存一个 timestamp。

MP4 用的是：

时间表（run-length encoding + 累加）
而不是：
sample → timestamp 的一一数组

二、MP4 的时间体系：先立坐标系

MP4 有几个“时间单位”？

至少要分清这三个：

层级	时间基
Movie（mvhd）	movie timescale
Track（tkhd / mdhd）	track timescale
Sample（stbl）	基于 track timescale

所有 sample 时间，最终都落在 track timescale 上

例如：

mdhd.timescale = 90000

那就和 RTP video 的 90 kHz 非常像，但语义完全不同。

三、stbl 里到底怎么“描述 sample 的时间”？

stbl（Sample Table Box）里，真正决定时间的只有三个 box：

`stts` —— Sample Decoding Time（最关键）

stts 的结构

(entry_count)
{
  sample_count,
  sample_delta
}[]

含义是：

连续 sample_count 个 sample，
它们的解码时间间隔都是 sample_delta

这就是“不是逐 sample 存 timestamp”的原因。

举个最典型的视频例子（固定帧率）

30 fps 视频，timescale = 90000：

stts:
sample_count = 300
sample_delta = 3000

计算方式：

90000 / 30 = 3000

第 N 个 sample 的 DTS：

DTS(N) = Σ sample_delta[0..N-1]

`ctts` —— Composition Time Offset（B 帧才有）

如果视频 有 B 帧：

解码顺序 ≠ 显示顺序
就需要 PTS ≠ DTS

这时候：

PTS = DTS + composition_offset

没有 B 帧的视频，根本没有 ctts box

`stss` —— Sync Sample（关键帧）

这个 box：

不决定时间
只告诉你：

哪些 sample 是 I 帧（可 seek 点）

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Damon_X

关注关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

FFmpeg时间戳详解

yinshipin007的博客

05-11

4245

1. I 帧/P 帧/B 帧 I 帧：I 帧(Intra-coded picture, 帧内编码帧，常称为关键帧)包含一幅完整的图像信息，属于帧内编码图像，不含运动矢量，在解码时不需要参考其他帧图像。因此在 I 帧图像处可以切换频道，而不会导致图像丢失或无法解码。I 帧图像用于阻止误差的累积和扩散。在闭合式 GOP 中，每个 GOP 的第一个帧一定是 I 帧，且当前 GOP 的数据不会参考前后 GOP 的数据。 P 帧：P 帧(Predictive-coded picture, 预测编码图像帧)是帧间编

FFmpeg音视频同步时间戳详解

宏的博客

07-17

3056

参与评论您还未登录，请先登录后发表或查看评论

音视频时间戳获取与同步原理详解

世界那么大，我想去看看～【偶尔更新，看世界去了😄】

08-07

1420

音视频时间戳获取与同步原理详解

FFmpeg中的时间戳详解

cindywry的博客

08-05

1766

本文转自：https://www.cnblogs.com/leisure_chn/p/10584910.html 1. I帧/P帧/B帧 I帧：I帧(Intra-coded picture, 帧内编码帧，常称为关键帧)包含一幅完整的图像信息，属于帧内编码图像，不含运动矢量，在解码时不需要参考其他帧图像。因此在I帧图像处可以切换频道，而不会导致图像丢失或无法解码。I帧图像用于阻止误差的累积和扩散。在闭合式GOP中，每个GOP的第一个帧一定是I帧，且当前GOP的数据不会参考前后GOP的数据。 P帧：P帧(

FFmpeg —— FFmpeg时间戳详解

天空的博客

04-30

1万+

1. I帧/P帧/B帧 I帧：I帧(Intra-coded picture, 帧内编码帧，常称为关键帧)包含一幅完整的图像信息，属于帧内编码图像，不含运动矢量，在解码时不需要参考其他帧图像。因此在I帧图像处可以切换频道，而不会导致图像丢失或无法解码。I帧图像用于阻止误差的累积和扩散。在闭合式GOP中，每个GOP的第一个帧一定是I帧，且当前GOP的数据不会参考前后GOP的数据。 P帧：P帧(Pr...

MP4封装格式详解

Garllic的博客

07-30

2916

是容器box，定义了MP4文件的元数据信息，在文件中有且仅有一个，moov里面包含的子box作为描述媒体数据的信息的容器。多媒体实际数据，如音频或视频数据，则在moov box中被引用，但不包含在其中。moov至少包含以下3种box中的一种，也可以包含其他（这里不做介绍）mvhd：Movie Header Box，存放多媒体信息头的容器。cmov：CompressMovie box，压缩过的电影信息容器。rmra：Reference Movie box，参考电影信息容器。

Docker管理容器的命令详解

m0_75233142的博客

12-26

1160

Docker管理容器的命令详解

Docker镜像和容器命令使用详解

qq_44749491的博客

09-01

8547

一键学会镜像和容器的使用

MP4格式详解

热门推荐

weixin_39399492的博客

11-13

1万+

mp4结构分析

【MP4】mp4文件详解（一）—— 一文看懂mp4文件格式

萧邯编程笔记

07-18

1万+

本系列系统总结MP4文件格式，从格式详解、MP4分析工具、MP4开源库解析等几篇文章来进行系统性总结和梳理。如有错漏，敬请指出，欢迎随时交流。MP4官方文档:mp4文件格式又被称为MPEG-4 Part 14，出自MPEG-4标准第14部分。它是一种多媒体格式容器，广泛用于包装视频和音频数据流、海报、字幕等。(顺便一提，目前流行的视频编码格式AVC/H264定义在MPEG-4 Part 10)。MP4是最常见的封装格式之一，因为其跨平台的特性而得到广泛应用。

MP4文件格式解析与Box结构详解

08-05

MP4文件格式，作为当前多媒体领域广泛使用的一种数字容器格式，主要用于存储视频和音频数据。它的核心是基于ISO基础媒体文件格式标准，广泛应用于网络流媒体、数字电视广播以及本地媒体播放等多个场景。了解MP4文件...

根据srt去掉无人声的地方视频保留对白视频去掉没有说话的段

vfvfb_csdn_我的地盘

12-15

675

【摘要】本文介绍了一种快速去除视频中无对白片段的方法。通过加载视频及字幕文件，利用字幕时间线自动识别并截取有对话的部分，批量处理后仅保留人物对白片段。操作步骤包括：拖入视频和字幕文件、点击加载、执行批量截取，最后合并有效片段即可获得仅含对话内容的精简视频。该方法适用于需要提取纯对话场景或去除空白背景音的视频编辑需求。

ESP Audio Effects音频库迎来专业升级，v1.2.0 新增动态控制核心

m0_59195407的博客

12-15

890

乐鑫发布ESPAudioEffects音频效果库v1.2.0，新增专业级动态音频处理功能。该版本首次集成动态范围控制(DRC)和多频段动态范围压缩(MBC)两大模块，支持全采样率、多声道及多种位宽格式，可精细化调节各频段音频特性。该库兼容ESP32全系列芯片，采用模块化设计，为智能音箱、语音助手等设备提供专业音频处理方案，推动嵌入式音频处理技术向更专业方向发展。

【人工智能-03-05】20251214 人工智能第二学期课程《计算机网络技术》简答题，“剪映”音频转字幕，导出文字txt

reasonsummer的博客

12-16

427

【人工智能-03-05】20251214 人工智能第二学期课程《计算机网络技术》简单题，“剪映”音频转字幕，导出文字txt

播放器视频后处理实践（二）氛围模式

lihui49的博客

12-16

847

氛围模式是一种视觉增强功能，通过技术手段有效解决了视频比例不匹配导致的黑边问题，显著提升了用户视觉体验，主要表现在如下几个方面：1. 视觉沉浸：氛围模式通过在视频周围添加柔和的背景颜色，使屏幕的边缘与视频内容更好地融合。这种设计使得用户在观看视频时感觉更加沉浸，减少了视频与周围环境之间的视觉割裂2. 舒适观看：这种模式可以减少长时间观看视频时的眼睛疲劳。通过在视频周围使用柔和的色彩过渡，可以缓解亮度差异带来的视觉刺激，从而提高观看舒适度。

如何判断一个视频到底是真实 MP4 直链，还是流媒体M3U8

weixin_45691961的博客

12-18

157

抖音 / TikTok分享链接解析 → 通常是真实 MP4快手新视频：MP4老视频：部分 m3u8B站99% 是DASH（音视频分离）微博信息流：MP4播放页：m3u8。

从视频生成到机器人操控：VideoVLA 开启通用机器人新范式