![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
OFD开发
阿徐汇
这个作者很懒,什么都没留下…
展开
-
OFD开发系列(三)-文本提取
一、提取场景和之前文章类似,我们首先明确文本提取的场景。文本提取是指提取OFD正文的文本数据,然后将文本存储到搜索引擎以对OFD文档进行更好的归档、检索等;文本也可以提取摘要数据方便预览信息;文本还可以分词、分类等,对文档进行智能化分类。这些用法,大大的提高了文档检索效率。注意,ofdrw的文本提取不包含模板页,只提取正文页。二、准备工作同样的,我们首先引入ofdrw的依赖包,如下所示:<!--junit--><dependency> <gr..原创 2020-11-20 12:29:27 · 5154 阅读 · 9 评论 -
OFD开发系列(二)-模板填充
接上篇我们前面对水印填充方法进行了简单介绍,本章描述的模板填充,可以是正文的填充,也可以是水印填充,水印填充可参考上一篇《OFD开发系列(一)-添加水印》。一、什么是模板填充模板填充是指基于固定的模板文档,在指定的位置(坐标/百分比)或文本替换填入所需的图片、文本、日期等内容,最后生成一个可用的文档以供用户存档、检索、签署等。我们知道,PDF可以使用表单填充,并且可以设置文字的字体、颜色、字号、对齐方式等。而在OFD版式文档里,没有表单的概念,我们需要采用其它方法进行填充。如下所示:1.1、原创 2020-11-16 19:55:40 · 4483 阅读 · 0 评论 -
OFD开发系列(一)-添加水印
一、OFD前言 OFD文档目前在国内如雨后春笋般出现,这要归功于OFD本身巧妙的版式设计、友好的国标文档《GBT_33190-2016_电子文件存储与交换格式版式文档》和各大开源作者的贡献。目前参与到该版式文档的,除了数科、福析等商业公司之外,还有很多个人开发者的项目,值得学习研究,例如:ofdrw、iofd、ofd.js等。OFD应用广泛,目前在税局发票和电子合同应用较多。在可预见的未来,OFD即将成为比肩PDF的文档标准。OFD基于xml语言描述,有一定的层级结构,最后打包成zip,扩...原创 2020-10-26 16:01:17 · 8229 阅读 · 21 评论