使用Itext读取PDF
package com.pdfbox.pdf;
import com.itextpdf.text.pdf.PdfReader;
import com.itextpdf.text.pdf.parser.PdfTextExtractor;
/**
* 使用iText读取PDF
* @author LGF 2015-01-04
*
*/
public class ItextReadPDF {
public static void main(String[] args) throws Exception {
//获取 PdfReader 对象,文件名称要是在classpath中的文件
PdfReader read = new PdfReader("MyBatis3.2.2中文官方文档.pdf");
//获取pdf中页数
int pageCount = read.getNumberOfPages();
System.out.println("page count : " + pageCount);
//循环遍历取出内容.
//PdfTextExtractor.getTextFromPage(read,page)方法调用
//注意: i要从 1 开始
for (int i = 1; i <= pageCount ; i++) {
String content = PdfTextExtractor.getTextFromPage(read, i);
System.out.println(content);
}
read.close();
}
}