- 博客(77)
- 资源 (24)
- 论坛 (7)
- 收藏
- 关注
原创 2020年总结一下吧
2021年了,时间真快,今天闲来无事,对过去的2020年做个简单的总结:1、2020年,年初和年末,都被疫情干扰了,没办法,小小的病毒,把人类干得一团糟,希望疫苗的出现,可以为人类挽回颜面。2、2020年复工初始,“豪言”换一台汉兰达,没有实现,失败。3、39岁的“老年人”写了一年的代码,说轻松呢?还是累呢?轻松因为心不累,不要考虑跑业务,搞团建,项目管理等等一堆杂七杂八的的事情;累是因为,由于代码写的太快,被扔来无数的活,当了彻彻底底的码农。4、健康情况,不容小觑——年中腹痛无比,查出是阑
2021-01-18 16:52:36
34
原创 PDF格式分析(六十五) Text 文字——字体数据结构
想必大家多用过word或wps这样的文本编辑器吧,输入文字的时候,我们可以选择很多不同的字体,这样,我们就可以展示给大家不同的文字形象,给大家不同的美感,而不会感觉单调。这些有的,没的,咱大家伙都知道,这就不赘述了,下面咱们来看看PDF中是怎么使用字体的。字体在PDF格式中,其表现形式为字典,这字典中,包含指定的字体类型、PostScript名称、编码以及在字体文件不可用时,使用的替换字体的信息。字体文件可以作为流对象嵌入在PDF文件中。字体类型通过字体字典中的【Subtype】条目来指定。通常
2021-01-18 16:24:02
33
原创 PDF格式分析(六十四) Text 文字——文本对象
这个章节,来说说文本对象。在PDF文档中,文本对象是一个非常重要的对象,它是PDF中重要的显示元素。PDF文本对象由运算符组成,这些运算符可以显示文本字符串、定位文本位置、设置文本状态以及其他参数。需要说明一下,正常情况下,文本参数可以影响到后面所有的文本属性,但是存在三个参数只能描述一个文本对象,不能从一个文本对象持续到下一个:Tm(),Tlm,Trm...
2021-01-15 15:48:40
31
原创 PDF格式分析(六十三) Text 文字——文本状态参数和操作子
1、字符间距 字符间距,参数Tc,后面跟有数字,该数字是未缩放文本空间单位指定的数字。当字符串在描绘时,应将Tc指定的间隔添加到字符之间(水平或垂直)。在默认坐标系中,水平方向:从左到右添加间隔,垂直方向:自下而上添加间隔。因此,Tc值对文字有很大的影响:扩大字符之间的距离。 注意:水平书写,Tc为正数,距离变大,而对于垂直书写,Tc为负数,距离变大。2、单词间距 单词间距与字符间距很相似,用来指定单词间的空白字符(ASCII空格字符)的宽度。单词间距使用参数T...
2020-11-27 20:26:02
110
原创 2020-11-27
心情异常不爽,很想和年轻人一样,拍着桌子,大声说“老*不干了,谁他*愿意干,谁干!”,但还是忍住了!中年人的成熟也好,胆小也罢,最终还是忍住了~真是憋屈!
2020-11-27 17:52:33
45
2
原创 PDF格式分析(六十二) Text 文字——字形定位和度量
字形宽度——也就是字形的水平位移,是它在水平书写的文本行的基线上占用的空间量。换言之,它是当前文本位置在绘制字形时(通过转换文本空间)应移动的距离。
2020-11-20 22:19:54
124
原创 2020-11-20
由于最近忙,加上自己确实也懒了些,关于PDF的更新确实少了点,为了不让自己的那点微末的能量毫无作用的消失,决定从本周起,每周至少一篇更新,欢迎大家交流指正。
2020-11-20 20:24:32
44
2
原创 程序员38岁
今年对于全世界的人来说,都不算是好的年份,肆虐全球的疫情,南方的暴雨洪灾,还有已经逼近的蝗虫大军,哪一个都不会让人高兴起来。对于我,一个程序员(其实可以不用开发的,但是不写代码,感觉自己的手艺越来越下滑),38岁,这个月初,不知道吃坏了东西,还是其他什么原因,总之,急性阑尾炎发作,无奈之下,做了阑尾炎微创手术,肚子上开了三个眼,看起来像长了三个肚脐眼。38岁,其实并不是很大的年纪,刚刚步入中年吧,其实我一直觉得自己还是个少年(自己都快吐了),喜欢玩游戏,熬夜看视频,喜欢和朋友聊当下的热点。但是,头上
2020-07-29 19:00:28
1388
6
原创 PDF格式分析(六十一) Text 文字——字体的使用
一、概要对于我们来说,文字是抽象的符号,表示特定的含义,而字形是文字以特定的图形在纸张或屏幕上的具体呈现。上面的三张图,就是同样的文字使用不同的字形而呈现的效果。一组字形的集合,就形成了字体。宋体和黑体,都是字体,这两个字体为一组标准汉字定义的字形。...
2020-04-06 12:49:15
1067
原创 PDF格式分析(六十) Text 文字——简介
本章将描述一个很重要的元素——文字,这是一个既简单,又复杂的元素,随着PDF的发展,由原来的复杂设计,慢慢的趋于简单和成熟。下面我们来了解一下:文字有三个要素:1、文本状态。这些状态从属于图形状态(子集),其中包括指定字体、字形缩放、颜色等。2、文本对象和运算符。文本运算符指定要绘制的字形,这些字形由字符代码序列表示。文本对象,则是由一系列文本运算符包含起来的内容和相关参数组成。3...
2019-08-16 21:03:51
1833
7
原创 如何利用PDF的增量写,还原PDF文档的迭代版本
PDF在创作完成后,生成的第一个版本,一般采用的是全新写方式,也就是所有的描述元素在前面,交叉索引表放在最后,当然还有另一种情况,PDF按线性化进行保存,这样的文档通常有两个交叉索引表,文档之初就有一个交叉索引表,文档最后有一个交叉索引表。 要进行PDF文档版本还原,就只需要从后往前找到交叉索引表的位置末端的位置,再从文件头开始读取,就可以得到前面的文档版本...
2019-07-08 15:14:14
649
1
转载 c++中嵌入python
https://www.cnblogs.com/earvin/p/5423868.htmlc++中嵌入python入门1本人是用vc2003+python2.5学习的,其它的也应该差不了多少0. 坏境设置把Python的include/libs目录分别加到vc的include/lib directories中去。另外,由于python没有提供debug lib,体地说,就是没有提供p...
2019-03-13 14:23:12
877
原创 PDF文件Content流解压缩
最近网上有一些朋友问到PDF文件中关于表格,文字,图片的解析,想通过直接看PDF的二进制流是不能做到的,下面我将介绍一个很简单的方法,直接上代码(使用了itextpdf):@Testpublic void testPdfTool() throws IOException {String outputPath = “d:\view.txt”;PrintWriter writer = new...
2019-02-26 18:42:59
2025
7
原创 迷茫的大叔
迷茫的大叔古人云,四十不惑,再过几年就达到不惑之年,按道理来说,无论看什么,考虑什么,都应该越来越清楚,但最近什么都看不清楚,想不明白。对于一个传统意义上的马上步入中年的大叔来说,现在IT寒冬,让人实实在在的看到给人打工,是多么的不稳定,上有老,下有小,这种不稳定造成了强大的危机感。根据有关调查,人生的价值主要是在40岁之后,真正体现的,为什么这么说呢,因为一个人在40岁之后创造的价值,是一...
2019-02-25 17:28:52
498
7
翻译 PDF格式分析(五十九) Color Spaces 颜色空间
因为PDF主要的应用领域是印刷行业,因此对颜色的要求比较严格,而且支持的颜色空间的类型特别多,通常分为三大类:设备颜色空间,直接指定输出设备要生成的颜色或灰度。它们提供了各种颜色规格方法,包括灰度、RGB(红-绿-蓝)和CMYK(青色-洋红色-黄-黑),对应于颜色空间:DeviceGray、DeviceRGB和DeviceCMYK。由于这些颜色空间没有参数而被归为一类。 CIE-based ...
2019-02-22 12:35:39
1763
1
翻译 PDF格式分析(五十八)Path Construction and Painting 路径的构建和描绘
路径可以定义各种形状(三角形,矩形,正方形等)、轨迹(直线,曲线)和区域。路径操作符用于绘制线条、定义填充区域的形状,以及指定剪切其他图形的边界。图形状态包括当前剪切路径,该路径定义当前页面的剪切边界。在每个页面的开头,剪切路径被初始化为包含整个页面,这个剪切路径是CropBox定义的,因为是剪切路径,所以,超过CropBox范围的元素,都不会显示。路径由直线和曲线组成,这些线可以相互连接。只...
2019-02-22 11:13:23
735
翻译 PDF格式分析(五十七)Graphics State 图形状态
图形状态——设备无关与设备无关的图形状态 参数 类型 说明 CTM array 当前转换矩阵,将位置从用户坐标映射到设备坐标(参考上一章“坐标系”)。该矩阵通过坐标变换操作符cm的应用进行修改,可以是多次。初始值:将默认用户坐标转换为设备坐标的矩阵。 clipping path (internal) 当前剪切路径,定义所有输出要剪切的边界。初始值:...
2019-02-21 14:19:32
1140
翻译 PDF格式分析(五十六)Coordinate Systems 坐标系
PDF中,所有绘制都在画布(也就是我们看到的页面page)上进行的。坐标系决定了显示在页面上的文本、图形和图像的位置、方向和大小。本节介绍PDF中使用的每个坐标系,包括它们之间的关系以及如何转换。 注:本节讨论的坐标系适用于 2D 图形。一、坐标空间 路径和位置是通过一对坐标进行定义的, x(横坐标) 和 y(纵坐标),表示二维坐标空间中的水平位置和垂直...
2019-02-20 17:49:46
1808
翻译 PDF格式分析(五十五)Graphics Objects 图形对象
内容流中存在两种类型的元素:一、图形对象(字体,shading,图片,通常用name对象表示),二、修饰图形对象的操作符(定位,缩放,颜色,大小,剪切,透明等),由这两类元素描绘出了页面的外观。PDF提供五种类型的图形对象:1、路径对象,可以是直线,矩形和贝塞尔曲线,或它们组合而成的任意形状。 路径可以自身相交。2、文本对象,由一个或多个字符串组成。3、外部对象(XObject),是在内容...
2018-10-25 11:10:50
1382
23
翻译 PDF格式分析(五十四)Graphics 图形
PDF内容流中使用的图形运算符,描述了在输出设备上(显示器和打印机)如何描绘页面的内容。图形运算符由六个类型组成:1、图形状态操作符,可以用来修饰其他任何图形。 图形状态包括当前变换矩阵(CTM),做来对图形的坐标映射到输出设备坐标。 它还包括颜色,剪切路径以及许多其他参数,这些参数是绘制操作符的隐式操作数。2、Path 路径构造操作符,可以指定路径(线条),这些路径定义各种形状,线轨迹和区...
2018-10-24 18:10:41
1160
翻译 PDF格式分析(五十三)Digital Signatures 数字签名-补充
撤销信息adbe撤销信息属性:adbe-revocationInfoArchival OBJECT IDENTIFIER ::={ adbe(1.2.840.113583) acrobat(1) security(1) 8 }revocation信息属性的值可以包括以下几种数据类型:证书撤销列表(CRL),CRL通常很大,因此不建议嵌入PKCS#7对象中。在线证书状态协议(OCSP)响应...
2018-09-30 10:16:41
3143
2
翻译 PDF格式分析(五十二)Digital Signatures 数字签名
数字签名(PDF 1.3)可用于验证用户的身份和文档的内容。 它在签名时,保存了有关签名者和文档状态的信息。签名可以是纯数学的,例如公钥/私钥加密文档摘要,或者它可以是生物识别形式的标识,例如手写签名,指纹或视网膜扫描。 使用的特定身份验证形式应由称为签名处理程序的特殊软件模块实现。 签字处理程序应根据附件E中规定的规则进行识别。ISO 32000中的数字签名目前支持两种活动:一、向文档添加数...
2018-09-25 18:19:36
5061
5
翻译 PDF格式分析(五十一)XFA Forms
简介XFA(也称为XFA表单)代表XML Forms Architecture,这是由JetForm建议和开发的一系列专有 XML规范,用于增强Web表单的处理。它也可以用于以PDF 1.5规范开头的PDF文件。XFA规范被引用作为ISO 32000-1规范(PDF 1.7)应用必不可少的外部规范。XML Forms Architecture未标准化为ISO标准。XFA表单保存在PDF文件内部...
2018-09-22 16:46:15
2409
5
翻译 PDF格式分析(五十)Forms Data Format 表单数据格式——文件结构
FDF文件的结构应与PDF文件基本相同,但仅包含导出和导入交互式表单和注释数据所需的那些元素。 它由以下元素组成:标题行,用于标识文件符合的PDF规范的版本号包含构成文件内容的对象的主体可选的交叉引用表,包含间接对象的位置信息可选的trailer,提供交叉引用表的位置以及文件正文中的某些特殊对象我们看个例子,增强大家的感官:%FDF-1.2%âãÏÓ1 0 obj<&l...
2018-09-22 16:09:38
835
翻译 PDF格式分析(四十九)Forms Data Format 表单数据格式——概述
本章描述了表单数据格式(FDF),该格式用于交互式表格数据的文件格式(PDF 1.2).FDF可在将表单数据提交给服务器,接收响应,并将响应结果合并到交互式表单中。 它还可用于将表单数据导出为独立的文件,这些文件可以存储,以电子方式传输,也可以导回到相应的PDF交互式表单中。 此外,从PDF 1.3开始,FDF可用于定义注释的容器,使得这些注释与它们所在PDF文档分离。FDF基于PDF; 它使...
2018-09-22 11:17:37
409
翻译 PDF格式分析(四十八)Forms Data Format 表单数据格式——介绍
FDF代表“表单数据格式”。FDF是一种文件格式,用于表示PDF格式中包含的表单数据和注释。FDF格式由Adobe Systems Incorporated发明,它基于PDF格式。您可以在Adobe的PDF参考中找到FDF格式的详细规范。FDF格式可用于各种工作流程。以下是几个示例:将表单数据发送到服务器并从服务器接收修改后的表单数据。此工作流程看起来像这样:表单数据以FDF格式提交给服...
2018-09-22 10:41:24
628
翻译 PDF格式分析(四十七)Named Pages 命名页面
文档名称字典中的可选Pages条目(PDF 1.3)(参见“名称字典”)包含一个名称树,它将名称字符串映射到文档中的各个页面。 命名页面允许以两种不同的方式引用它:导入数据操作时,把FDF导入到文档中,FDF中的命名页面可以作为其页面或按钮外观。由JavaScript操作执行的脚本可以将命名页面作为常规页面添加到当前文档。用户可见的命名页面应保留在 Page Tree 页面树中,并且在 ...
2018-09-22 10:16:26
543
1
翻译 PDF格式分析(四十六)Interactive Forms 交互式表单—— Signature Fields 签名
签名字段(PDF 1.3)是包含数字签名的表单字段(请参见“数字签名”)。 表示签名字段的字段字典在表1中列出的附加条目。字段类型(FT)应为Sig,字段值(V)(如果存在)是签名字典,是包含签名和相关的各种属性。填写(签名)签名字段需要至少更新V条目,并且通常还更新相关联的 widget 注释的AP条目。 导出签名字段通常会导出T,V和AP条目。与其他字段一样,签名字段可以由widget注释...
2018-09-20 17:49:18
936
翻译 PDF格式分析(四十五)Interactive Forms 交互式表单—— Choice Fields 选择域
Choice字段的字段类型应为Ch,可以包含多个文本项,其中一个或多个将被选为字段的值。 这些项目可以以下列两种形式之一呈现给用户:一个可滚动的列表框由下拉列表组成的组合框。 组合框伴随有可编辑的文本框,用户可以键入除预定义选项之外的值,通过Ff条目中的Edit位的值来决定。Choice字段的特定标志Bit position名称含义18Combo如果设置,则该...
2018-09-20 15:31:06
530
翻译 PDF格式分析(四十四)Interactive Forms 交互式表单——Text Fields 文本域
文本字段(字段类型Tx),简单说,就是文本输入框。 文本可以限制为单行,也可以允许跨越多行,具体取决于字段字典的Ff条目中Multiline标志的设置。 表1显示了文本框有关的标志:表1 特定于文本框的字段标志Bit position名称含义13Multiline如果设置,该文本框可能包含多行文本; 如果清除,该字段的文本应限制在一行。14Password如...
2018-09-20 14:41:54
835
翻译 PDF格式分析(四十三)Interactive Form 交互式表单——Button Fields 按钮域
Button字段(字段类型Btn)表示用户可以使用鼠标操作的屏幕上的交互式控件。 按钮字段有三种类型:pushbutton 按钮是一种简单的交互式控件,可用来立即响应用户输入,和网页的按钮功能类似。check box 复选框在两种状态(打开和关闭)之间进行切换,和网页中复选框类似。Radio button 单选按钮字段包含一组相关按钮,最多只能有一个被选中,与网页中的单选框类似。对于B...
2018-09-20 12:35:00
784
翻译 PDF格式分析(四十二)Interactive Form 交互式表单——类型
交互式表单支持以下 Field 字段类型:Button 按钮字段:表示用户可以使用鼠标操作的屏幕上的交互式控件。它们包括按钮,复选框和单选按钮。Text 文本字段:是用户可以从键盘输入文本的框或空白处。Choice 选择字段:包含多个文本项,最多可以选择其中之一作为该字段的值。 它们包括可滚动的列表框和组合框。Signature 签名字段:包含数字签名和可选数据,用于验证签名者姓名和文档...
2018-09-20 10:26:50
661
翻译 PDF格式分析(四十一)Interactive Forms 交互式表单——概要
交互式表单(PDF 1.2) - 有时也称为AcroForm–是通过交互方式,从用户端收集信息字段的集合。PDF文档中,任何页面都可以存在任意数量的字段,而所有这些字段可以构成跨越整个文档的单个全局交互式表单。这些字段的任意子集可以从文档导入或导出。文档交互表单中的每个字段都应由 field 字段字典定义。出于定义和命名的目的,可以按层次结构(树形结构)来组织字段,并且可以从字段层次结构中的...
2018-09-19 18:22:33
1303
翻译 PDF格式分析(四十)Trigger Events 触发事件
简介从PDF 1.7开始,PDF文档可以指定符合本标准的阅读器的用户界面如何呈现文件附件的Collections 汇集,这些附件与文档中的结构或内容是相关的,我们把这种呈现形式称为便携式集合(汇集)。便携式集合的目的是呈现、排序和搜索(嵌入在PDF文档中)相关文档的集合,例如电子邮件存档,照片集和工程投标集。 不要求集合中的文档具有隐含关系或甚至相似性; 但是,显示相关文档的区别特征可能有...
2018-09-17 18:48:23
539
翻译 PDF格式分析(三十八)Thumbnail Images 缩略图图片
PDF文档可以包含以微缩形式表示其页面内容的缩略图图像。 符合PDF标准的阅读器可以在屏幕上显示这些图像,允许用户通过单击其缩略图图像导航到对应的页面。(缩略图图像不是必需的,可能包含在某些页面中而不是全部页面。)页面的缩略图图像,位于页面对象中Thumb条目指定的图像XObject。 它具有图像字典(见“Image 图像字典”)的通用结构,但只有Width, Height, ColorSpa...
2018-09-17 14:27:34
894
翻译 PDF格式分析(三十七)Article thread
用途某些类型的文档可能会包含逻辑连接,而这个逻辑顺序并不是物理顺序。比如:新闻报道可以从新闻通讯的第一页开始,然后转到一个或多个非连续的内页。为了表示物理上不连续但逻辑相关的项目的序列,PDF文档定义了一个或多个Article(PDF 1.1)。 Article的顺序由article thread定义; 组成文章的各个内容项在线程上称为珠子(bead)。 用户可以通过点击从一个珠子到下一个...
2018-09-17 12:51:28
414
翻译 PDF格式分析(三十六)Document Catalog 详细说明
文档对象层次结构的根是 Catalog 字典,通过PDF文件 trailer 中的Root条目进行定位。 该目录包含对定义文档内容,大纲(outline),文章线程(article threads),命名目标(named destinations)和其他属性的其他对象的引用。 此外,它还包含有关如何在屏幕上显示文档的信息,例如是否应自动显示其大纲(outline)和缩略图页面图像(thumbnai...
2018-09-17 12:01:58
1618
1
翻译 PDF格式分析(三十五)Common Data Structures 通用格式结构
PDF格式中,一些通用数据结构是根据基本对象类型构建的,并且在整个PDF中的许多地方都使用。本章节会介绍文本字符串,日期,矩形,名称树和数字树的数据结构。String Object Types 字符串对象类型PDF 字符串对象根据具体的功能作用可以分为:文本字符串,PDFDocEncoded字符串,ASCII字符串或字节字符串。主要通过表示字符串描述的字符或字形的编码进行区分。字符...
2018-09-14 12:33:23
901
5
原创 PDF 水印(watermark)删除及防删除策略
现在几乎所有的公司都使用PDF文档。大多数这些公司的员工都需要与组织内外的个人共享包含敏感内容的文档。公司为了防止方式泄漏,帮助些别泄漏源等因素,通常将这些文档加上识别信息水印。本文将探讨一些用于水印删除与防删除的一些方法,欢迎大伙来喷。在PDF文档中,通过用特定图像或文字覆盖文档的每个页面来实现水印。水印可以是一种有效的技术,但只有在正确实施的情况下才能实现。通常,在安全的情况下,水印将包含...
2018-09-13 18:04:14
7409
3
转载 如何实现按距离排序、范围查找
现在几乎所有的O2O应用中都会存在“按范围搜素、离我最近、显示距离”等等基于位置的交互,那这样的功能是怎么实现的呢?本文提供的实现方式,适用于所有数据库。实现实现过程主要分为四步: 1. 搜索 在数据库中搜索出接近指定范围内的商户,如:搜索出1公里范围内的。 2. 过滤 搜索出来的结果可能会存在超过1公里的,需要再次过滤。如果对精度没有严格要求,可以跳过。 3. 排...
2018-09-13 11:20:00
4533
PMBOK指南第6版中文版
2018-04-04
org.apache.poi.xwpf.converter.core-1.0.2-sources
2016-01-29
在win32,win64下,float运算结果不同是什么原因
发表于 2015-10-23 最后回复 2015-11-03
linux c++编译:浮点数例外
发表于 2014-06-18 最后回复 2014-06-18
结构成员声明问题
发表于 2013-10-30 最后回复 2013-11-01
急急急,大神来帮忙解惑
发表于 2013-10-30 最后回复 2013-11-01
OLE stream是什么
发表于 2011-09-07 最后回复 2013-10-30
如何将两个xml在html中同步浏览
发表于 2009-09-27 最后回复 2012-11-23
如何平均分布点阵
发表于 2010-10-21 最后回复 2010-10-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人 TA的粉丝