java程序中的坐标_java – 使用PDFbox确定文档中单词的坐标

最新推荐文章于 2024-03-07 10:22:58 发布

weixin_39733232

最新推荐文章于 2024-03-07 10:22:58 发布

阅读量295

点赞数

文章标签： java程序中的坐标

本文链接：https://blog.csdn.net/weixin_39733232/article/details/114754843

版权

我正在使用PDFbox来提取PDF文档中的单词/字符串的坐标,并且迄今已经成功地确定了单个字符的位置.这是迄今为止的代码,从PDFbox doc：

package printtextlocations;

import java.io.*;

import org.apache.pdfbox.exceptions.InvalidPasswordException;

import org.apache.pdfbox.pdmodel.PDDocument;

import org.apache.pdfbox.pdmodel.PDPage;

import org.apache.pdfbox.pdmodel.common.PDStream;

import org.apache.pdfbox.util.PDFTextStripper;

import org.apache.pdfbox.util.TextPosition;

import java.io.IOException;

import java.util.List;

public class PrintTextLocations extends PDFTextStripper {

public PrintTextLocations() throws IOException {

super.setSortByPosition(true);

}

public static void main(String[] args) throws Exception {

PDDocument document = null;

try {

File input = new File("C:\\path\\to\\PDF.pdf");

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注