引用PDFBox-0.7.3,提取内容文本

1、引用bcprov-jdk14-132.dll、IKVM.GNU.Classpath.dll、IKVM.Runtime.dll、PDFBox-0.7.3.dll(系统将自动引用其他相关的DLL,包括bcmail-jdk14-132.dll、FontBox-0.1.0-dev.dll、lucene-core-2.0.0.dll、lucene-demos-2.0.0.dll)

注:在没有完全加载时,可能会报如下或类似的错误“为什么会报这样的一个错误“java.io.File”的类型初始值设定项引发异常

PDFBox-0.7.3.zip下载地址:

http://www.hiwis.com/document/pdfbox-0.7.3.zip

https://jaist.dl.sourceforge.net/project/pdfbox/PDFBox/PDFBox-0.7.3/PDFBox-0.7.3.zip

2、引用

using java.net;
using org.pdfbox.pdmodel;
using org.pdfbox.util;

3、提取文件

public static string ParseToTxtStringUsingPDFBox(string filename)
        {
            try
            {
                PDDocument document = null;
                //java.io.File file = new java.io.File(filename);
                document = PDDocument.load(filename);

                PDFTextStripper stripper = new PDFTextStripper();
                return(stripper.getText(document));
            }
            catch (MalformedURLException e1)
            {
                return(e1.getMessage());
            }
        }

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值