1.TS格式介绍
TS:全称为MPEG2-TS。TS即"Transport Stream"的缩写。它是分包发送的,每一个包长为188字节(还有192和204个字节的包)。包的结构为,包头为4个字节(第一个字节为0x47),负载为184个字节。在TS流里可以填入很多类型的数据,如视频、音频、自定义信息等。MPEG2-TS主要应用于实时传送的节目,比如实时广播的电视节目。MPEG2-TS格式的特点就是要求从视频流的任一片段开始都是可以独立解码的。简单地说,将DVD上的VOB文件的前面一截cut掉(或者是数据损坏数据)就会导致整个文件无法解码,而电视节目是任何时候打开电视机都能解码(收看)的。
TS解析需要参考:ISO/IEC 13818-1的2.4 Transport Stream bitstream requirements
TS的包结构:
包头信息说明
Packet Header(包头)信息说明 | |||
1 | sync_byte | 8bits | 同步字节 |
2 | transport_error_indicator | 1bit | 错误指示信息(1:该包至少有1bits传输错误) |
3 | payload_unit_start_indicator | 1bit | 负载单元开始标志(packet不满188字节时需填充) |
4 | transport_priority | 1bit | 传输优先级标志(1:优先级高) |
5 | PID | 13bits | Packet ID号码,唯一的号码对应不同的包 |
6 | transport_scrambling_control | 2bits | 加密标志(00:未加密;其他表示已加密) |
7 | adaptation_field_control | 2bits | 附加区域控制 |
8 | continuity_counter | 4bits | 包递增计数器 |
2.TS流包含的内容
BAT解析例举:
TS-包1:
这个包比较特别,为什么说它是第一个包呢,因为 continuity_counter=0 & payload_unit_start_indicator=1。
也就是说任何SCTION段过滤器都开始于continuity_counter=0的TS包,continuity_counter有4BIT 1-15这样计算的的话,SECTION最大为184X16=2944 Byte。
那么SECTION究竟有多大的,这要取决于要解析的SECTION语法,取出有效载荷的前3 Byte也就知道了SCTION的长度,计算公式通常为:
secLen = ((uint16_t)(buf[1] & 0xf)) << 8 | buf[2]) buf为有效载荷的起始位置。详见BAT表语法结构。
概述如下:
1、包递增器为0,表示为第一个SCTION的开始,包递增器为0的TS包payload_unit_start_indicator=1,其它情况下payload_unit_start_indicator=0。
2、有效载荷的具体位置取决于 包头4+附加区域长度+负载单元起始位置。
3、每个SCTION长度为包含在有效载荷的前3Byte。
解复用器中通常使用payload_unit_start_indicator=1作为判断新包的开始。
47 40 11 10 表示无调整字段,有负载单元起始标志,那么有效载荷的起始位置为data[5]以后,有效载荷长度为183,有效载荷的前3Byte为 4a f2 ed,换算出当前的SCTION长度为secLen=749 Byte。
TS-包2
47 00 11 11 表示无调整字段,无负载单元起始标志,那么有效载荷的起始位置为data[4]以后,有效载荷长度为184。
TS-包3:
47 00 11 12 表示无调整字段,无负载单元起始标志,那么有效载荷的起始位置为data[4]以后,有效载荷长度为184。
TS-包4
47 00 11 13 表示无调整字段,无负载单元起始标志,那么有效载荷的起始位置为data[4]以后,有效载荷长度为184。
TS-包5
47 00 11 14 表示无调整字段,无负载单元起始标志,那么有效载荷的起始位置为data[4]以后,有效载荷长度为17。
这是当前SCTION的最后一个TS包,那么怎么判断是最后一个包呢?
首先我们解析了第一个TS包时得出secLen=749,随着包递增器的增加,我们陆续获取有效载荷,749-183-184-184-184=17,所以当解析到第5个TS包时,有效载荷为17 Bype,BAT完成数据的获取工作,BAT的语法解析如下:
========================================================================================================================
一段TS流,必须包含PAT包、PMT包、多个音频包、多个视频包、多个PCR包、以及其他信息包。
解析TS流数据的流程:查找PID为0x0的包,解析PAT,PAT包中的program_map_PID表示PMT的PID;查找PMT,PMT包中的elementary_PID表示音视频包的PID,PMT包中的PCR_PID表示PCR的PID,有的时候PCR的PID跟音频或者视频的PID相同,说明PCR会融进音视频的包,注意解析,有的时候PCR是自己单独的包;CAT、NIT、SDT、EIT的PID分别为: 0x01、0x10、0x11、0x12。
下面我们来分析,在ISO/IEC 13818-1里有说明,BAT的PID值为0x11,TS包的标识(即sync_byte)为0x47,并且为了确保这个TS包里的数据有效,所以我们一开始查找47 40 11这三组16进制数,为什么这样?具体的奥秘在TS包的结构上,前面已经说了sync_byte固定为0x47。现在往下看transport_error_indicator、payload_unit_start_indicator、transport_priority和PID这四个元素,PID为0x11,这是BAT的标识。transport_error_indicator为0,transport_priority为0。把他们看成是两组8位16进制数就是:40 11。现在看看我们的TS流片断例子,看来正好是47 40 11开头的,一个TS流的头部占据了4个字节。剩下的负载部分的内容由PID来决定,例子看来就是一个BAT表。在这里有个地方需要注意一下,payload_unit_start_indicator为1时,在前4个字节之后会有一个调整字节,它的数值决定了负载内容的具体开始位置。现在看例子中的数据47 40 11 10 00第五个字节是00,说明紧跟着00之后就是具体的负载内容,也就是说4a f2 ed后面是载荷。
到现在为止,引申出TS包有效载荷的定位问题,有效载荷定位要注意两点:
1、自适应区的大小
2、“payload_unit_start_indicator” 有效载荷的起始区域
我们以“tsBuf[]”为例,“tsBuf[]”存储了一帧TS包,tsBuf[0]=0x47,TS的同步头,那么tsBuf[4]为自适应区域的长度。
transport_packet(){ sync_byte ... adaptation_field_control 2 bslbf continuity_counter 4 uimsbf if(adaptation_field_control == '10' || adaptation_field_control == '11'){ adaptation_field() } ... }
tsBuf[4]=adaptation_field_length
adaptation_field(){ adaptation_field_length 8 uimsbf if(adaptation_field_length>0){ ... PCR_flag 1 bslbf ... if(PCR_flag == '1'){ program_clock_reference_base 33 uimsbf Reserved 6 bslbf program_clock_reference_extension 9 uimsbf ... } } }
关于自适应区的ISO/IEC 13818-1语法如下:
3.TS包头解析
TS包头有4个字节
//Transport Stream header
typedef
struct
TS_header
{
unsigned sync_byte :8;
//同步字节,固定为0x47 ,表示后面的是一个TS分组,当然,后面包中的数据是不会出现0x47的
unsigned transport_error_indicator :1;
//传输错误标志位,一般传输错误的话就不会处理这个包了
unsigned payload_unit_start_indicator :1;
//有效负载的开始标志,根据后面有效负载的内容不同功能也不同
// payload_unit_start_indicator为1时,在前4个字节之后会有一个调整字节,它的数值决定了负载内容的具体开始位置。
unsigned transport_priority :1;
//传输优先级位,1表示高优先级
unsigned PID :13;
//有效负载数据的类型
unsigned transport_scrambling_control :2;
//加密标志位,00表示未加密
unsigned adaption_field_control :2;
//调整字段控制,。01仅含有效负载,10仅含调整字段,11含有调整字段和有效负载。为00的话解码器不进行处理。
unsigned continuity_counter :4;
//一个4bit的计数器,范围0-15
} TS_header;
//特殊参数说明:
//sync_byte:0x47
//payload_unit_start_indicator:0x01表示含有PSI或者PES头
//PID:0x0表示后面负载内容为PAT,不同的PID表示不同的负载
//adaption_field_control:
// 0x0: // reserved for future use by ISO/IEC
// 0x1: // 无调整字段,仅含有效负载
// 0x2: // 仅含调整字段,无有效负载
// 0x3: // 调整字段后含有效负载
// Parse TS header
int
Parse_TS_header(unsigned
char
*pTSBuf, TS_header *pheader)
{
pheader->sync_byte = pTSBuf[0];
if
(pheader->sync_byte != 0x47)
return
-1;
pheader->transport_error_indicator = pTSBuf[1] >> 7;
pheader->payload_unit_start_indicator = pTSBuf[1] >> 6 & 0x01;
pheader->transport_priority = pTSBuf[1] >> 5 & 0x01;
pheader->PID = (pTSBuf[1] & 0x1F) << 8 | pTSBuf[2];
pheader->transport_scrambling_control = pTSBuf[3] >> 6;
pheader->adaption_field_control = pTSBuf[3] >> 4 & 0x03;
pheader->continuity_counter = pTSBuf[3] & 0x0F;
return
0;
}
|
TS包头解析需要参考:ISO/IEC 13818-1的2.4.3.2 Transport Stream packet layer
4.TS负载格式解析
4.1 PAT解析
TS_header包头中的PID值为0x0,表示当前负载为PAT(Program Association Table)。PAT数据的信息可以理解为整个TS流包含的节目信息。
// Program Association Table
typedef
struct
PAT_Packet_tag
{
unsigned table_id : 8;
//固定为0x00 ,标志是该表是PAT
unsigned section_syntax_indicator : 1;
//段语法标志位,固定为1
unsigned zero : 1;
//0
unsigned reserved_1 : 2;
// 保留位
unsigned section_length : 12;
//表示这个字节后面有用的字节数,包括CRC32
unsigned transport_stream_id : 16;
//该传输流的ID,区别于一个网络中其它多路复用的流
unsigned reserved_2 : 2;
// 保留位
unsigned version_number : 5;
//范围0-31,表示PAT的版本号
unsigned current_next_indicator : 1;
//发送的PAT是当前有效还是下一个PAT有效
unsigned section_number : 8;
//分段的号码。PAT可能分为多段传输,第一段为00,以后每个分段加1,最多可能有256个分段
unsigned last_section_number : 8;
//最后一个分段的号码
// for(i=0; i<N; i++)
// {
unsigned program_number : 16;
unsigned reserved_3 : 3;
unsigned network_PID : 16;
// 或者program_map_PID
unsigned CRC_32 : 32;
// }
} PAT_Packet;
// Parse PAT
int
Parse_PAT(unsigned
char
*pTSBuf, PAT_Packet *packet)
{
TS_header TSheader;
if
(Parse_TS_packet_header(pTSBuf, &TSheader) != 0)
return
-1;
if
(TSheader.payload_unit_start_indicator == 0x01)
// 表示含有PSI或者PES头
{
if
(TSheader.PID == 0x0)
// 表示PAT
{
int
iBeginlen = 4;
int
adaptation_field_length = pTSBuf[4];
switch
(TSheader.adaption_field_control)
{
case
0x0:
// reserved for future use by ISO/IEC
return
-1;
case
0x1:
// 无调整字段,仅含有效负载
iBeginlen += pTSBuf[iBeginlen] + 1;
// + pointer_field
break
;
case
0x2:
// 仅含调整字段,无有效负载
return
-1;
case
0x3:
// 调整字段后含有效负载
if
(adaptation_field_length > 0)
{
iBeginlen += 1;
// adaptation_field_length占8位
iBeginlen += adaptation_field_length;
// + adaptation_field_length
}
else
{
iBeginlen += 1;
// adaptation_field_length占8位
}
iBeginlen += pTSBuf[iBeginlen] + 1;
// + pointer_field
break
;
default
:
break
;
}
unsigned
char
*pPAT = pTSBuf + iBeginlen;
packet->table_id = pTSBuf[0];
packet->section_syntax_indicator = pTSBuf[1] >> 7;
packet->zero = pTSBuf[1] >> 6 & 0x1;
packet->reserved_1 = pTSBuf[1] >> 4 & 0x3;
packet->section_length = (pTSBuf[1] & 0x0F) << 8 | pTSBuf[2];
packet->transport_stream_id = pTSBuf[3] << 8 | pTSBuf[4];
packet->reserved_2 = pTSBuf[5] >> 6;
packet->version_number = pTSBuf[5] >> 1 & 0x1F;
packet->current_next_indicator = (pTSBuf[5] << 7) >> 7;
packet->section_number = pTSBuf[6];
packet->last_section_number = pTSBuf[7];
int
len = 0;
len = 3 + packet->section_length;
packet->CRC_32 = (pTSBuf[len-4] & 0x000000FF) << 24
| (pTSBuf[len-3] & 0x000000FF) << 16
| (pTSBuf[len-2] & 0x000000FF) << 8
| (pTSBuf[len-1] & 0x000000FF);
int
n = 0;
for
( n = 0; n < (packet->section_length - 12); n += 4 )
{
packet->program_number = pTSBuf[8 + n ] << 8 | pTSBuf[9 + n ];
packet->reserved_3 = pTSBuf[10 + n ] >> 5;
if
( packet->program_number == 0x00)
{
packet->network_PID = (pTSBuf[10 + n ] & 0x1F) << 8 | pTSBuf[11 + n ];
}
else
{
// 有效的PMT的PID,然后通过这个PID值去查找PMT包
program_map_PID = (pTSBuf[10 + n] & 0x1F) << 8 | pTSBuf[11 + n];
}
}
return
0;
}
}
return
-1;
}
|
PAT数据解析需要参考:ISO/IEC 13818-1的2.4.4.3 Program Association Table
4.2 PMT解析
由PAT包中的program_map_PID可以确定PMT(Program Map Table)的PID。PMT数据的信息可以理解为这个节目包含的音频和视频信息。
// Program Map Table
typedef
struct
PMT_Packet_tag
{
unsigned table_id : 8;
unsigned section_syntax_indicator : 1;
unsigned zero : 1;
unsigned reserved_1 : 2;
unsigned section_length : 12;
unsigned program_number : 16;
unsigned reserved_2 : 2;
unsigned version_number : 5;
unsigned current_next_indicator : 1;
unsigned section_number : 8;
unsigned last_section_number : 8;
unsigned reserved_3 : 3;
unsigned PCR_PID : 13;
unsigned reserved_4 : 4;
unsigned program_info_length : 12;
// for(i=0; i<N; i++)
// {
unsigned stream_type : 8;
unsigned reserved_5 : 3;
unsigned elementary_PID : 13;
unsigned reserved_6 : 4;
unsigned ES_info_length : 12;
// }
unsigned CRC_32 : 32;
} PMT_Packet;
// Parse PMT
int
Parse_PMT(unsigned
char
*pTSBuf, PMT_Packet *packet)
{
// 参考Parse_PAT()来做就行了
// ...
return
0;
}
|
PMT数据解析需要参考:ISO/IEC 13818-1的2.4.4.8 Program Map Table
4.3 PES解析
根据文档参考PAT、PMT的解析流程就能完成PES的解析了。
需要注意的是PES中PTS的解析,一般来说在90 kHz 中,PTS/9000的值为秒单位。
unsigned
long
long
Parse_PTS(unsigned *pBuf)
{
unsigned
long
long
llpts = (((unsigned
long
long
)(pBuf[0] & 0x0E)) << 29)
| (unsigned
long
long
)(pBuf[1] << 22)
| (((unsigned
long
long
)(pBuf[2] & 0xFE)) << 14)
| (unsigned
long
long
)(pBuf[3] << 7)
| (unsigned
long
long
)(pBuf[4] >> 1);
return
llpts;
}
|
PES数据解析需要参考:2.5.5.1 Syntax of the PES packet syntax for Program Stream directory