PDF格式中,一些通用数据结构是根据基本对象类型构建的,并且在整个PDF中的许多地方都使用。本章节会介绍文本字符串,日期,矩形,名称树和数字树的数据结构。
String Object Types 字符串对象类型
PDF 字符串对象根据具体的功能作用可以分为:文本字符串,PDFDocEncoded字符串,ASCII字符串或字节字符串。主要通过表示字符串描述的字符或字形的编码进行区分。
字符串对象类型如下表:
类型 | 描述 |
---|---|
text string | 应用于人工可读的文本,例如文本注释,书签名称,文章名称和文档信息。 这些字符串应使用PDFDocEncoding或带有前导字节顺序标记的UTF-16BE进行编码。 |
PDFDocEncoded string | 用于单个字节中表示的字符和字形。 |
ASCII string | 用于使用ASCII编码在单个字节中表示的字符。 |
byte string |