EXIF格式分析及通过XML处理(3)

EXIF格式分析及通过XML处理

 

猛禽[Mental Studio](个人专栏)(BLOG)

http://mental.mentsu.com

 

下面是一个典型的EXIF JPEG文件格式分析结果(源文件为一张用Nikon CoolPixel 775相机拍摄的照片,所用的EXIF版本是2.1,与2.2版差别不大):

 

JPEG SOI : FF D8  //  图片起始

JPEG APP1: FF E1

  APP1 Size : 1C 45  //  注意:前面这三个WORD都是big endian

  EXIF Flag : 'Exif', 0, 0

  TIFF Header:

    Byte Order: 'II'

    Flag      : 2A 00

    IFD0 offset : 08 00 00 00

      Entries Count : 0B 00 // 11

      IFD Entry :

          Tag    : 0E 01  //  Image Description 图像说明

          Type   : 02 00  //  ASCII

          Size  : 0B 00 00 00

          Value : 92 00 00 00  //  from TIFF Header

      IFD Entry:

          Tag    : 0F 01  //  Make 制造

          Type   : 02 00

          Size  : 06 00 00 00

          Value: B2 00 00 00

      IFD Entry:

          Tag    : 10 01  //  Model 型号

          Type   : 02 00

          Size  : 05 00 00 00

          Value: CA 00 00 00

       

      IFD Entry:

          Tag    : 69 87  //  EXIF IFD

          Type   : 04 00  //  LONG

          Size  : 01 00 00 00

          Value: 1C 01 00 00  //  Offset of EXIF IFD

    END of IFD0

    IFD1 Offset : 18 03 00 00

    ...  //  存放IFDValue数据

    EXIF IFD :

      Entries Count : 18 00

      IFD Entry :

          Tag    : 9A 82  //  Exposure time

          ...

    END of EXIF IFD

    Next IFD : 00 00 00 00  //  按标准IFD链表约定,表示没有后继IFD

    ...  //  存放EXIF IFDValue数据

    IFD1 :  //  EXIF中用于存放缩略图

      Entries Count : 06 00

      IFD Entry :

          Tag    : 03 01

          ...

    END of IFD1

    Next IFD : 00 00 00 00  //  EXIF只用到两个TIFF IFD

    ... //  Thumbnail etc.

  //  end of TIFF header

  //  其它JPEG Marker segments

JPEG EOI : FF D9  //  图片结束

 

EXIF格式的分析,至此基本上告一个段落了。从分析结果上可以看出,EXIF是一种非常灵活的格式,具有非常好的可扩充性,要想较好地处理其中的相关数据也是比较麻烦的。

其困难主要在于几个方面:

1、对于每种不同的IFD Entry Type,需要用不同的方法获取数据,特别是对于数据长度不同时,可能采用不同的数据存储方式,而IFD Entry的数量又可能很多,每个Entry根据Tag不同又有不同的意义

2、EXIF IFD是作为TIFF IFD的子链表形式存在(因为EXIFIFD里定义了不同于TIFF标准的Tag,要保持与标准的TIFF格式互用,必须这样做),使得原来的链表结构变成了树形结构

3、Tag的种类和数量非常之大,在EXIF规范里定义了各个Tag的支持级别(见[1]4.6.8),光是JPEG格式下必须支持的Tag就有十几个,TIFF格式更多,再加上可选支持的Tag,有几十上百个,并且还存在未来继续扩充的可能

4、对于可支持不同语言的软件来说,同一个Tag的意义要用每一种支持的语言表达一次,如果将这部分处理写入代码,对于增加新的语言支持会带来不必要的麻烦

为了解决这些困难,必须要找到一个同样是非常灵活的处理方法来处理EXIF数据。而XML正是这样一种方法。从前面的分析结果可以看出,EXIF的数据记录方式是层层嵌套的树形结构,是非常适合用XML的,因为XML也是这样的树形结构。

通过定义一套XML标签,然后将EXIF数据转换成XML文档,可以最大限度地保留EXIF数据的原始内容及结构。并且作为一种通用格式,XML可以很方便地进行再处理,比如:通过XSLT进行转换,使之成为HTML或其它便于显示的格式;或者将此XML传递给其它软件作进一步处理等。

对于前面说到的困难,XML都很好地解决:

1、不同类型的问题,通过转换为XML,将所有的Value都转换成字符串,便于统一处理

2、XML本来就是树形结构,可以在转换的时候方便地通过调整节点位置,使各IFD统一处理

3、可以将所有的Tag原样导出到XML中,在以后对XML的处理时再根据Tag进行处理,比如通过修改XSL文件实现对新增Tag的支持

4、同样是对XML处理时才需要面对具体的Tag,比如为不同的语言提供相应的XSL文件即可

(待续)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值