- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 OFD开发系列(三)-文本提取
一、提取场景和之前文章类似,我们首先明确文本提取的场景。文本提取是指提取OFD正文的文本数据,然后将文本存储到搜索引擎以对OFD文档进行更好的归档、检索等;文本也可以提取摘要数据方便预览信息;文本还可以分词、分类等,对文档进行智能化分类。这些用法,大大的提高了文档检索效率。注意,ofdrw的文本提取不包含模板页,只提取正文页。二、准备工作同样的,我们首先引入ofdrw的依赖包,如下所示:<!--junit--><dependency> <gr..
2020-11-20 12:29:27 5276 9
原创 OFD开发系列(二)-模板填充
接上篇我们前面对水印填充方法进行了简单介绍,本章描述的模板填充,可以是正文的填充,也可以是水印填充,水印填充可参考上一篇《OFD开发系列(一)-添加水印》。一、什么是模板填充模板填充是指基于固定的模板文档,在指定的位置(坐标/百分比)或文本替换填入所需的图片、文本、日期等内容,最后生成一个可用的文档以供用户存档、检索、签署等。我们知道,PDF可以使用表单填充,并且可以设置文字的字体、颜色、字号、对齐方式等。而在OFD版式文档里,没有表单的概念,我们需要采用其它方法进行填充。如下所示:1.1、
2020-11-16 19:55:40 4586
原创 OFD开发系列(一)-添加水印
一、OFD前言 OFD文档目前在国内如雨后春笋般出现,这要归功于OFD本身巧妙的版式设计、友好的国标文档《GBT_33190-2016_电子文件存储与交换格式版式文档》和各大开源作者的贡献。目前参与到该版式文档的,除了数科、福析等商业公司之外,还有很多个人开发者的项目,值得学习研究,例如:ofdrw、iofd、ofd.js等。OFD应用广泛,目前在税局发票和电子合同应用较多。在可预见的未来,OFD即将成为比肩PDF的文档标准。OFD基于xml语言描述,有一定的层级结构,最后打包成zip,扩...
2020-10-26 16:01:17 8364 21
转载 常见JVM面试题及答案整理
前言总结了JVM一些经典面试题,分享出我自己的解题思路,希望对大家有帮助,有哪里你觉得不正确的话,欢迎指出,后续有空会更新。1.什么情况下会发生栈内存溢出。思路:描述栈定义,再描述为什么会溢出,再说明一下相关配置参数,OK的话可以给面试官手写是一个栈溢出的demo。我的答案:栈是线程私有的,他的生命周期与线程相同,每个方法在执行的时候都会创建一个栈帧,用来存储局部变量表,操作数栈,动态链接,方法出口等信息。局部变量表又包含基本数据类型,对象引用类型 如果线程请求的栈深度大于虚拟机所允.
2020-08-14 13:52:57 307
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人