简单的说,EBML是类似于XML那样的层次化结构,每一个元素都有它的ID(就是元素名)和值。另外由于是二进制存储,还含有一个长度值来记录它的值的长度,每个元素的排列是ID,长度,值。由于EBML使用不定长整数存储方式,那么ID和长度这两个变量到底占用多少个字节,这就需要解析出Leading bits的个数。Leading bits也被称为Length Descriptor。这里要说的length就是Leading bits的个数。具体的EBML标准,可以参考官方说明:http://ebml.sourceforge.net/specs/
按照Matroska的标准,Leading bits的最大个数是8。下面介绍几种获得length的方法。
1、方法一
uint8_t getlen(uint8_t *data, uint64_t *number) {
uint8_t *point = data;
uint8_t tmpdata = floor(log2(point[0]));
uint8_t length = 8 - tmpdata;
*number ^= point[0] ^ (1 << tmpdata);
for (uint8_t n = 1; n < length; n++) {
*number = (*number << 8) | point[n];
}
return length;
}
2、方法二
uint8_t getlen(uint8_t *data, uint64_t *number) {
uint8_t *point = data;
uint8_t length = 1;
uint8_t m = 0x80;
while (!(point[0] & m)) {
m >>= 1;
++lenth;
}
*number = point[0] ^ m;
for (uint8_t n = 1; n < length; n++) {
*number = (*number << 8) | point[n];
}
return length;
}
3、方法三
const uint8_t ff_log2_tab[256]={
0,0,1,1,2,2,2,2,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,
5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,
6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,
6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,
7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7
};
uint8_t getlen(uint8_t *data, uint64_t *number) {
uint8_t *point = data;
uint8_t length = 8 - ff_log2_tab(point[0]);
*number ^= point[0] ^ (1 << ff_log2_tab(point[0]));
for (uint8_t n = 1; n < length; n++) {
*number = (*number << 8) | point[n];
}
return length;
}
说明:
(1)length即为Leading bits的个数。根据length的值,就可以获得ID或后面的数据的长度,即*number的值。
(2)方法三是ffmpeg使用的一种处理方式。事先将floor(log2(point[0]))的值定义好,然后直接使用。不过,如果Leading bits的最大允许值大于8,那就比较麻烦了。
(3)这三个方法只适合于Leading bits的最大允许值为8的情况,如果大于8,还需要适当的修改。