EBML格式计算length算法总结

最新推荐文章于 2019-12-27 17:34:29 发布

EagleAIGC

最新推荐文章于 2019-12-27 17:34:29 发布

阅读量1.6k

点赞数

本文链接：https://blog.csdn.net/yu_yuan_1314/article/details/9613571

版权

媒体文件格式专栏收录该内容

29 篇文章 3 订阅

订阅专栏

简单的说，EBML是类似于XML那样的层次化结构，每一个元素都有它的ID（就是元素名）和值。另外由于是二进制存储，还含有一个长度值来记录它的值的长度，每个元素的排列是ID，长度，值。由于EBML使用不定长整数存储方式，那么ID和长度这两个变量到底占用多少个字节，这就需要解析出Leading bits的个数。Leading bits也被称为Length Descriptor。这里要说的length就是Leading bits的个数。具体的EBML标准，可以参考官方说明：http://ebml.sourceforge.net/specs/

按照Matroska的标准，Leading bits的最大个数是8。下面介绍几种获得length的方法。

1、方法一

uint8_t getlen(uint8_t *data, uint64_t *number) {
    uint8_t *point = data;
    uint8_t tmpdata = floor(log2(point[0]));
    uint8_t length = 8 - tmpdata;
    
    *number ^= point[0] ^ (1 << tmpdata);  
    for (uint8_t n = 1; n < length; n++) {
        *number = (*number << 8) | point[n];
    }

    return length;
}

2、方法二

uint8_t getlen(uint8_t *data, uint64_t *number) {

    uint8_t *point = data;
    uint8_t length = 1;
    uint8_t m = 0x80;

    while (!(point[0] & m)) {
        m >>= 1;
        ++lenth;
    }

    *number = point[0] ^ m;
    for (uint8_t n = 1; n < length; n++) {
        *number = (*number << 8) | point[n];
    }

    return length;
}

3、方法三

const uint8_t ff_log2_tab[256]={
        0,0,1,1,2,2,2,2,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,4,
        5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,5,
        6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,
        6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,6,
        7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
        7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
        7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
        7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7
};

uint8_t getlen(uint8_t *data, uint64_t *number) {
    uint8_t *point = data;
    uint8_t length = 8 - ff_log2_tab(point[0]);
    
    *number ^= point[0] ^ (1 << ff_log2_tab(point[0]));  
    for (uint8_t n = 1; n < length; n++) {
        *number = (*number << 8) | point[n];
    }

    return length;
}

说明：

（1）length即为Leading bits的个数。根据length的值，就可以获得ID或后面的数据的长度，即*number的值。

（2）方法三是ffmpeg使用的一种处理方式。事先将floor(log2(point[0]))的值定义好，然后直接使用。不过，如果Leading bits的最大允许值大于8，那就比较麻烦了。

（3）这三个方法只适合于Leading bits的最大允许值为8的情况，如果大于8，还需要适当的修改。

EagleAIGC

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
EBML格式计算length算法总结

关于EBML格式，这里就不多说了。Leading bits也被称为Length Descriptor。这里要说的length就是Leading bits的个数。按照Matroska的标准，Leading bits的最大个数是8。下面介绍几种获得length的方法。1、方法一uint8_t data = 读取一个字节；uint8_t tmp = floor(log2(data));u
复制链接

扫一扫