首先,在学习中接触到了pdfbox,感觉用它处理pdf文档确实很方便,从网上找到一段处理文档的代码,但运行中发现一些问题,具体的解决方法如下,希望给你有所帮助,
首先在myeclipse中建立一个java工程,
从pdfbox官网中下载pdfbox,然后将pdfbox中的相关jar包导入工程中,建立buildpath,具体方法可以从网上搜索。
建立一个java文件,
具体代码如下:
package pdfbox;
import java.io.BufferedReader;
import java.io.File;
import java.io.FileOutputStream;
import java.io.FileReader;
import java.io.OutputStreamWriter;
import java.io.Writer;
import java.net.MalformedURLException;
import java.net.URL;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;
public class Pdfbox {
public static final String DEFAULT_ENCODING = "UTF-8";
// "ISO-8859-1";
// "ISO-8859-6";
// "US-ASCII";
// "UTF-8";
// "UTF-16";
// "UTF-16BE";
// "UTF-16LE";
public void geText(String file) throws Exception {
// 是否排序
boolean sort = false