秋风之刀
这个作者很懒,什么都没留下…
展开
-
PDF格式分析(八十六)——修订注释(Redaction)
PDF阅读器应删除修订注释指定的区域的内容,在被删除的位置用可见的标记这些区域。PDF编辑器可指定应删除的文档内容片段或区域,在执行下一个步骤前,用户可以看到、移动和重新定义这些注释。(可选)由三个数组成的数组,范围为0.0至1.0,这三个数为 DeviceRGB的三个参数,以便在移除受影响的内容后,填充涂写区域。修订注释(PDF 1.7及其以上版本),该注释的做用是标识要从文档中删除的内容。假如此条目不存在,编辑区域的内部保持透明。如果RO条目存在,则忽略此条目。如果RO条目存在,则忽略此条目。原创 2024-06-13 22:31:57 · 443 阅读 · 0 评论 -
PDF格式分析(八十五)——水印注释(Watermark)
水印注释(PDF1.6及其以上版本),水印可表现为文字、图片、图像,水印大小固定,显示在页面位置固定,而不论打印页的尺寸(注意打印时,可能打印不全哟)。需要注意的是:水印注释没有弹出窗口。原创 2024-06-06 22:16:51 · 592 阅读 · 0 评论 -
PDF格式分析(八十四)——小部件注释(Widget)
小部件注释(PDF1.2及其以上版本),用于表示交互式表单的外观,并管理其与用户的交互。原创 2024-06-05 23:25:30 · 315 阅读 · 0 评论 -
PDF格式分析(八十二)——电影注释(movie)
电影注释(PDF1.2及其以上版本),该注释包含图像和声音,声音通过扬声器进行播放,图像则显示在计算机屏幕上,如同一个视频播放器一样。当该类型注释被激活时,视频将被播放。(可选)电影注释的标题。s”可以使用这个标题来引用电影注释。原创 2024-06-03 22:01:27 · 338 阅读 · 0 评论 -
PDF格式分析(八十一)——声音注释(Sound)
声音注释(PDF 1.2),它保存了从计算机麦克风录制的音频信息,或从音频文件导入的音频信息。当激活该类注释时,会播放声音。通常,该注释类似于文本注释,也使用不同的图标(默认情况下是个扬声器)。声音对象(PDF 1.2)是包含音频信息的流对象,这些音频信息可以通过计算机扬声器进行播放音。该对象可以通过声音注释或声音动作词典中的声音条目来指定,并被激活播放。原创 2022-09-19 14:42:21 · 638 阅读 · 1 评论 -
PDF格式分析(八十)——弹出、文件附件注释(Popup、FileAttachment)
弹出注释(PDF 1.3),非常常见的注释,但并不单独存在,一般是在别的注释(父注释)在打开状态时,才弹出该注释,可以在弹出窗口中显示文本以供输入和编辑。有该注释不存在自己的外观流或相关动作,并应通过父注释字典中的Popup条目进行区别。文件附件注释(PDF 1.3),与word文档中的附件相似,在PDF文档中表现为对文件的引用,通常嵌入PDF文件中(“嵌入文件流”后面章节进行介绍)。原创 2022-09-17 13:56:24 · 706 阅读 · 0 评论 -
PDF格式分析(七十九)——图章、墨迹注释(Stamp、Ink)
图章注释(PDF 1.3),PDF文档中常见的注释之一,在PDF文档中显示为文本或图形,看起来像是用图章压印在页面上。当注释为打开状态时,会弹出显示包含相关注释文本的弹出窗口。墨迹注释(PDF 1.3),常见的PDF注释之一,绝大部分的浏览器和编辑器都支持添加的一种注释。原创 2022-09-17 11:26:57 · 1149 阅读 · 0 评论 -
PDF格式分析(七十八)——文本标记、插入注释(Text Markup、Caret)
文本标记注释,属于非常常见的注释,读者在阅读PDF文档时,对重要文字片段进行标注的手段之一。一般的在文档中表现为:选中文字伴随高亮、下划线、删除线(所有PDF 1.3)、波浪线(PDF 1.4)。当注释为打开状态时,弹出显示包含相关注释文本的弹出窗口。插入符号注释(PDF 1.5)是一种视觉符号,表示存在文本编辑。一般的PDF编辑器不提供这种注释的添加。原创 2022-09-17 10:58:34 · 601 阅读 · 0 评论 -
PDF格式分析(七十七)——多边形和折线注释(Polygon 、Polyline)
多边形和折线注释(PDF 1.5),属于PDF文档中常见的注释。一般的,多边形注释在页面上显示为一个闭合多边形,这种多边形由任意数量的直线连接而成。折线与多边形类似,区别只是第一个顶点和最后一个顶点没有隐式连接。原创 2022-09-17 10:26:35 · 540 阅读 · 0 评论 -
PDF格式分析(七十六)——方形和圆形注释(Square、Circle)
正方形和圆形注释(PDF 1.3),属于PDF文档中比较常见的注释,在页面上显示为一个矩形或椭圆形。注释在打开状态时,会弹出包含相关注释文本的弹出窗口。值得注意的是,尽管名称为Square和Circle,但注释矩形的宽度和高度不必相等,这样就可以显示为矩形和椭圆。原创 2022-09-17 09:45:36 · 563 阅读 · 0 评论 -
PDF格式分析(七十五)——线型注释(Line)
线型注释(PDF 1.3)是一种非常常见的注释,在页面上显示为一条直线。当为打开状态时,会弹出一个显示相关注释文本的弹出窗口。原创 2022-09-16 17:51:48 · 667 阅读 · 0 评论 -
PDF格式分析(七十四)——自由文本注释(Free Text)
自由文本注释(PDF 1.3),可以直接在页面上显示文本。与普通文本注释(见前面章节)不同,自由文本注释没有打开或关闭状态;文本始终是可见状态,且不是显示在弹出窗口中。原创 2022-09-15 17:54:01 · 639 阅读 · 0 评论 -
PDF格式分析(七十三)——链接注释
链接注释,类似与word中的超链接,可以通过点击链接注释,跳转到指定的位置,可以是本文档,也可以是其他文档,也可以是网页地址。原创 2022-09-15 16:30:03 · 383 阅读 · 0 评论 -
PDF格式分析(七十二)——文本注释
文本注释,就像是附加到PDF文档中某个点上的“便笺”。在关闭的状态时,文本注释显示为一个特定图标(可以指定不同的样式);在打开状态时,会显示一个弹出窗口,该弹出窗口内显示文本内容,且文本的字体和大小也是可以设置的。文本注释不得随页面缩放和旋转。原创 2022-09-14 17:47:46 · 466 阅读 · 0 评论 -
PDF格式分析(七十一)—— Markup注释
PDF中大部分注释类型是属于Markup annotation(标记)——Text(文字)、FreeText(自由文字)、Line(线)、Square(正方形)、Circle(圆形)、Polygon(多边形)、PolyLine(多线段)、Highlight(高亮)、Underline(下划线)、Squiggly(波浪线)、StrikeOut(删除线)、Stamp(邮戳)、Caret(插入符)、Ink(墨水)、FileAttachment(附件)、Sound(声音)、Redact(编校)原创 2022-09-14 14:31:41 · 618 阅读 · 0 评论 -
PDF格式分析(七十)——注释边框样式及外观流
NoZoom、NoRotate确定是否跟随页面进行缩放和旋转。从PDF 1.4开始,注释外观可以包括透明度,使用外观的流字典中的。原创 2022-08-30 17:16:24 · 467 阅读 · 0 评论 -
PDF格式分析(六十九)——注释字典
上一个章节主要描述了注释的概要信息,大家对注释有个大体的印象,本章将对注释进行详细的介绍,尤其会描述注释的核心内容:注释字典()。从PDF的结构可以看出,本身是一个树形结构,而注释的父节点就来自Page字典对象,其在Page字典对象的条目为“”,为可选项,也就是说,没有注释的情况下,该条目可以不存在。“”条目指向一个数组对象(如果为引用对象,该对象引用一个数组对象),其包含一组注释字典,每个字典表示与给定页面相关的注释。.........原创 2022-08-30 14:25:59 · 609 阅读 · 0 评论 -
PDF格式分析(六十八)——注释(批注)概要
今天说说PDF的注释annotation,也有中文翻译为批注的。 由于PDF属于版式排版,不同于流式排版(Word文档),它主要是用来排版印刷,所以,每个字,每个图,每个符号,都要精确的显示在输出设备上,所以,有些人想在PDF中,添加内容,其实是违背PDF设计的本意的。 PDF作为电子书进行阅读,对于读者来说,在看书的过程中,想写下一些感想,或者画一下重点,这都是很正常的需求,PDF为这种需求,专门设计的一套对象,那就是批注(annots),其类型包含:Text(文字)、Link原创 2022-08-30 10:57:14 · 1729 阅读 · 0 评论 -
PDF格式分析(六十七) Text 文字——字符编码( Character Encoding)
字体编码是字符代码和字形描述之间的关联关系,对于程序员来说,字符编码非常熟悉,经常遇到的乱码问题,基本上都是字符编码不正确造成的原创 2022-02-07 13:35:11 · 3764 阅读 · 0 评论 -
PDF格式分析(六十六) Text 文字——简单字体
这个章节,我们来看看介绍一下简单字体。简单字体,一般都具有以下属性:文本显示运算符(如Tj)显示的字符串由单字节字符代码组成。从逻辑上讲,这些代码会索引到一个包含256个glyph的表中;从代码到glyph的映射称为字体编码(这是一个很重要的要素,后面章节会介绍)。 每个字形(glyph)应具有一组单独的度量值,包括水平位移或宽度;注意,简单字体仅支持水平书写模式。 除了Type0字体、未标记PDF文档中的Type3类字体和某些标准Type1字体外,每个字体字典都应包含一个字体描述字典,该字典中原创 2021-03-10 11:21:34 · 2015 阅读 · 2 评论 -
PDF格式分析(六十五) Text 文字——字体数据结构
想必大家多用过word或wps这样的文本编辑器吧,输入文字的时候,我们可以选择很多不同的字体,这样,我们就可以展示给大家不同的文字形象,给大家不同的美感,而不会感觉单调。这些有的,没的,咱大家伙都知道,这就不赘述了,下面咱们来看看PDF中是怎么使用字体的。字体在PDF格式中,其表现形式为字典,这字典中,包含指定的字体类型、PostScript名称、编码以及在字体文件不可用时,使用的替换字体的信息。字体文件可以作为流对象嵌入在PDF文件中。字体类型通过字体字典中的【Subtype】条目来指定。通常原创 2021-01-18 16:24:02 · 1705 阅读 · 0 评论 -
PDF格式分析(六十四) Text 文字——文本对象
这个章节,来说说文本对象。在PDF文档中,文本对象是一个非常重要的对象,它是PDF中重要的显示元素。PDF文本对象由运算符组成,这些运算符可以显示文本字符串、定位文本位置、设置文本状态以及其他参数。需要说明一下,正常情况下,文本参数可以影响到后面所有的文本属性,但是存在三个参数只能描述一个文本对象,不能从一个文本对象持续到下一个:Tm(),Tlm,Trm...原创 2021-01-15 15:48:40 · 1806 阅读 · 1 评论 -
PDF格式分析(六十三) Text 文字——文本状态参数和操作子
1、字符间距 字符间距,参数Tc,后面跟有数字,该数字是未缩放文本空间单位指定的数字。当字符串在描绘时,应将Tc指定的间隔添加到字符之间(水平或垂直)。在默认坐标系中,水平方向:从左到右添加间隔,垂直方向:自下而上添加间隔。因此,Tc值对文字有很大的影响:扩大字符之间的距离。 注意:水平书写,Tc为正数,距离变大,而对于垂直书写,Tc为负数,距离变大。2、单词间距 单词间距与字符间距很相似,用来指定单词间的空白字符(ASCII空格字符)的宽度。单词间距使用参数T...原创 2020-11-27 20:26:02 · 1382 阅读 · 0 评论 -
PDF格式分析(六十二) Text 文字——字形定位和度量
字形宽度——也就是字形的水平位移,是它在水平书写的文本行的基线上占用的空间量。换言之,它是当前文本位置在绘制字形时(通过转换文本空间)应移动的距离。原创 2020-11-20 22:19:54 · 1601 阅读 · 0 评论 -
2020-11-20
由于最近忙,加上自己确实也懒了些,关于PDF的更新确实少了点,为了不让自己的那点微末的能量毫无作用的消失,决定从本周起,每周至少一篇更新,欢迎大家交流指正。原创 2020-11-20 20:24:32 · 411 阅读 · 5 评论 -
PDF格式分析(六十一) Text 文字——字体的使用
一、概要对于我们来说,文字是抽象的符号,表示特定的含义,而字形是文字以特定的图形在纸张或屏幕上的具体呈现。上面的三张图,就是同样的文字使用不同的字形而呈现的效果。一组字形的集合,就形成了字体。宋体和黑体,都是字体,这两个字体为一组标准汉字定义的字形。...原创 2020-04-06 12:49:15 · 2988 阅读 · 1 评论 -
PDF格式分析(四十六)Interactive Forms 交互式表单—— Signature Fields 签名
签名字段(PDF 1.3)是包含数字签名的表单字段(请参见“数字签名”)。 表示签名字段的字段字典在表1中列出的附加条目。字段类型(FT)应为Sig,字段值(V)(如果存在)是签名字典,是包含签名和相关的各种属性。填写(签名)签名字段需要至少更新V条目,并且通常还更新相关联的 widget 注释的AP条目。 导出签名字段通常会导出T,V和AP条目。与其他字段一样,签名字段可以由widget注释...翻译 2018-09-20 17:49:18 · 1907 阅读 · 0 评论 -
PDF格式分析(四十五)Interactive Forms 交互式表单—— Choice Fields 选择域
Choice字段的字段类型应为Ch,可以包含多个文本项,其中一个或多个将被选为字段的值。 这些项目可以以下列两种形式之一呈现给用户:一个可滚动的列表框由下拉列表组成的组合框。 组合框伴随有可编辑的文本框,用户可以键入除预定义选项之外的值,通过Ff条目中的Edit位的值来决定。Choice字段的特定标志Bit position名称含义18Combo如果设置,则该...翻译 2018-09-20 15:31:06 · 1000 阅读 · 0 评论 -
PDF格式分析(四十四)Interactive Forms 交互式表单——Text Fields 文本域
文本字段(字段类型Tx),简单说,就是文本输入框。 文本可以限制为单行,也可以允许跨越多行,具体取决于字段字典的Ff条目中Multiline标志的设置。 表1显示了文本框有关的标志:表1 特定于文本框的字段标志Bit position名称含义13Multiline如果设置,该文本框可能包含多行文本; 如果清除,该字段的文本应限制在一行。14Password如...翻译 2018-09-20 14:41:54 · 1715 阅读 · 0 评论 -
PDF格式分析(四十三)Interactive Form 交互式表单——Button Fields 按钮域
Button字段(字段类型Btn)表示用户可以使用鼠标操作的屏幕上的交互式控件。 按钮字段有三种类型:pushbutton 按钮是一种简单的交互式控件,可用来立即响应用户输入,和网页的按钮功能类似。check box 复选框在两种状态(打开和关闭)之间进行切换,和网页中复选框类似。Radio button 单选按钮字段包含一组相关按钮,最多只能有一个被选中,与网页中的单选框类似。对于B...翻译 2018-09-20 12:35:00 · 1652 阅读 · 0 评论 -
PDF格式分析(四十二)Interactive Form 交互式表单——类型
交互式表单支持以下 Field 字段类型:Button 按钮字段:表示用户可以使用鼠标操作的屏幕上的交互式控件。它们包括按钮,复选框和单选按钮。Text 文本字段:是用户可以从键盘输入文本的框或空白处。Choice 选择字段:包含多个文本项,最多可以选择其中之一作为该字段的值。 它们包括可滚动的列表框和组合框。Signature 签名字段:包含数字签名和可选数据,用于验证签名者姓名和文档...翻译 2018-09-20 10:26:50 · 1414 阅读 · 0 评论 -
PDF格式分析(五十二)Digital Signatures 数字签名
数字签名(PDF 1.3)可用于验证用户的身份和文档的内容。 它在签名时,保存了有关签名者和文档状态的信息。签名可以是纯数学的,例如公钥/私钥加密文档摘要,或者它可以是生物识别形式的标识,例如手写签名,指纹或视网膜扫描。 使用的特定身份验证形式应由称为签名处理程序的特殊软件模块实现。 签字处理程序应根据附件E中规定的规则进行识别。ISO 32000中的数字签名目前支持两种活动:一、向文档添加数...原创 2018-09-25 18:19:36 · 8823 阅读 · 8 评论 -
PDF格式分析(四十一)Interactive Forms 交互式表单——概要
交互式表单(PDF 1.2) - 有时也称为AcroForm–是通过交互方式,从用户端收集信息字段的集合。PDF文档中,任何页面都可以存在任意数量的字段,而所有这些字段可以构成跨越整个文档的单个全局交互式表单。这些字段的任意子集可以从文档导入或导出。文档交互表单中的每个字段都应由 field 字段字典定义。出于定义和命名的目的,可以按层次结构(树形结构)来组织字段,并且可以从字段层次结构中的...翻译 2018-09-19 18:22:33 · 2551 阅读 · 2 评论 -
PDF格式分析(三十五)Common Data Structures 通用格式结构
PDF格式中,一些通用数据结构是根据基本对象类型构建的,并且在整个PDF中的许多地方都使用。本章节会介绍文本字符串,日期,矩形,名称树和数字树的数据结构。String Object Types 字符串对象类型PDF 字符串对象根据具体的功能作用可以分为:文本字符串,PDFDocEncoded字符串,ASCII字符串或字节字符串。主要通过表示字符串描述的字符或字形的编码进行区分。字符...翻译 2018-09-14 12:33:23 · 1597 阅读 · 5 评论 -
PDF 水印(watermark)删除及防删除策略
现在几乎所有的公司都使用PDF文档。大多数这些公司的员工都需要与组织内外的个人共享包含敏感内容的文档。公司为了防止方式泄漏,帮助些别泄漏源等因素,通常将这些文档加上识别信息水印。本文将探讨一些用于水印删除与防删除的一些方法,欢迎大伙来喷。在PDF文档中,通过用特定图像或文字覆盖文档的每个页面来实现水印。水印可以是一种有效的技术,但只有在正确实施的情况下才能实现。通常,在安全的情况下,水印将包含...原创 2018-09-13 18:04:14 · 10835 阅读 · 6 评论 -
PDF格式分析(四十)Trigger Events 触发事件
简介从PDF 1.7开始,PDF文档可以指定符合本标准的阅读器的用户界面如何呈现文件附件的Collections 汇集,这些附件与文档中的结构或内容是相关的,我们把这种呈现形式称为便携式集合(汇集)。便携式集合的目的是呈现、排序和搜索(嵌入在PDF文档中)相关文档的集合,例如电子邮件存档,照片集和工程投标集。 不要求集合中的文档具有隐含关系或甚至相似性; 但是,显示相关文档的区别特征可能有...翻译 2018-09-17 18:48:23 · 1245 阅读 · 0 评论 -
PDF格式分析(三十四)Linearized PDF 线性化 - Embedded File Stream Hint Tables(嵌入式文件流提示表)
嵌入式文件流提示表,允许符合标准的阅读器定位访问其嵌入文件流所需的PDF文件的所有字节范围。 嵌入的文件流可以与它引用的其他对象分组; 这样一个组中的所有对象都应具有相邻的对象编号。 (如果组包含共享对象引用,则组不应包含任何对象。)该提示表应有一个标题部分(见表1),该部分应包含有关嵌入式文件流组的一般信息。 标题部分后面应有表2中的条目。 对于每个嵌入式文件流组(表1中第3项表示的组数),...原创 2018-09-10 17:33:04 · 880 阅读 · 0 评论 -
PDF格式分析(三十三)Linearized PDF 线性化 - Extended Generic Hint Tables(扩展的通用提示表)
扩展通用提示表应以与通用提示表中相同的条目开头,并且后面应有三个附加条目,如表1所示。 此表提供了访问引用共享对象的对象的提示。 从PDF 1.5开始,如果需要,以下提示表应使用扩展通用格式: •交互式表单提示表 •逻辑结构提示表 •renditions名称树提示表此提示表不包括嵌入式文件流,即使它们可以从renditions名称树中的节点访问; 相反,他们应使用“嵌入式文件流提示表”中...原创 2018-09-10 17:32:40 · 626 阅读 · 0 评论 -
PDF格式分析(三十二)Linearized PDF 线性化 - Generic Hint Tables(通用提示表)
对象类别与整个文档相关联,而不是与单个页面相关联(“其他对象(第9部分)”),并且应提供有效访问这些对象的提示。 对于每个类别的提示,主要提示流中应有一个单独的条目,给出流中表的起始位置。此类提示应由通用提示表表示,该表描述了一组位于PDF文件中的对象。 表1中列出了该表中的条目。 如果需要,此表示应用于以下提示表: •大纲提示表 •线程信息提示表 •命名目标提示表 •信息字典提示表 ...原创 2018-09-10 17:32:15 · 711 阅读 · 0 评论 -
PDF格式分析(六十) Text 文字——简介
本章将描述一个很重要的元素——文字,这是一个既简单,又复杂的元素,随着PDF的发展,由原来的复杂设计,慢慢的趋于简单和成熟。下面我们来了解一下:文字有三个要素:1、文本状态。这些状态从属于图形状态(子集),其中包括指定字体、字形缩放、颜色等。2、文本对象和运算符。文本运算符指定要绘制的字形,这些字形由字符代码序列表示。文本对象,则是由一系列文本运算符包含起来的内容和相关参数组成。3...原创 2019-08-16 21:03:51 · 3230 阅读 · 7 评论