PDFBOX处理PDF文档

本文介绍了如何使用PDFBOX处理PDF文档,特别是在遇到中文乱码问题时的解决方案。首先,确保使用UTF-8编码,并检查PDF文档格式。如果遇到问题,尝试升级PDFBox到1.1.0版本,替换旧的fontbox和pdfbox jar包。
摘要由CSDN通过智能技术生成

首先,在学习中接触到了pdfbox,感觉用它处理pdf文档确实很方便,从网上找到一段处理文档的代码,但运行中发现一些问题,具体的解决方法如下,希望给你有所帮助,

首先在myeclipse中建立一个java工程,

从pdfbox官网中下载pdfbox,然后将pdfbox中的相关jar包导入工程中,建立buildpath,具体方法可以从网上搜索。

建立一个java文件,

具体代码如下:

package pdfbox;


import java.io.BufferedReader;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.net.MalformedURLException;
import java.net.URL;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

public class Pdfbox {
public static final String DEFAULT_ENCODING = "UTF-8";


// "ISO-8859-1";
// "ISO-8859-6";
// "US-ASCII";
// "UTF-8";
// "UTF-16";
// "UTF-16BE";
// "UTF-16LE";
public void geText(String file) throws Exception {
// 是否排序
boolean sort = false

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值