poi提取纯文本的时候,提取word的时候,POITextExtractor extractor = ExtractorFactory.createExtractor(is);这行代码不执行也不报错,后来把代码提出来main方法执行,发现少了一个JAR包,少了poi-scratchpad-3.8-20120326.jar

wKiom1LLaUrxeNPIAAAcXgwigOA156.jpg

wKioL1LLaT-zNkyxAAAOSGDuMYM105.jpg


这水印太碍事了 看不清了,怎么能去掉呢,先这样了


具体实现参考http://www.huqiwen.com/2012/11/02/extractor-text-from-office-pdf-html/