POI3.8读取WORD(简洁实例)


目前最新版POI为3.8: 
poi-3.8-20120326.jar 
poi-examples-3.8-20120326.jar 
poi-excelant-3.8-20120326.jar 
poi-ooxml-3.8-20120326.jar 
poi-ooxml-schemas-3.8-20120326.jar 
poi-scratchpad-3.8-20120326.jar 

Java代码   收藏代码
  1. import java.io.FileInputStream;  
  2. import java.io.FileOutputStream;  
  3. import java.io.IOException;  
  4. import java.io.InputStream;  
  5.   
  6. import javax.servlet.ServletException;  
  7. import javax.servlet.http.HttpServlet;  
  8. import javax.servlet.http.HttpServletRequest;  
  9. import javax.servlet.http.HttpServletResponse;  
  10.   
  11. import org.apache.poi.hwpf.HWPFDocument;  
  12. import org.apache.poi.hwpf.extractor.WordExtractor;  
  13. import org.apache.poi.hwpf.model.PicturesTable;  
  14. import org.apache.poi.hwpf.usermodel.CharacterRun;  
  15. import org.apache.poi.hwpf.usermodel.Picture;  
  16. import org.apache.poi.hwpf.usermodel.Range;  
  17.   
  18.   
  19.   
  20. public class WordDemo extends HttpServlet {  
  21.   
  22.     private static final long serialVersionUID = 1L;  
  23.   
  24.     public void doGet(HttpServletRequest request, HttpServletResponse response)  
  25.             throws ServletException, IOException {  
  26.         this.doPost(request, response);  
  27.     }  
  28.   
  29.     public void doPost(HttpServletRequest request, HttpServletResponse response)  
  30.             throws ServletException, IOException {  
  31.           
  32.         //从硬盘读取一个doc文档  
  33.         InputStream in = new FileInputStream("F:\\test.doc");  
  34.         //类从word文档中提取文本,非特殊情况下,都将使用getParagraphText()与getText()  
  35.         WordExtractor word = new WordExtractor(in);  
  36.           
  37.         //获取段文本  
  38.         String [] strArray = word.getParagraphText();  
  39.         String str = word.getText();    
  40.           
  41.         for(int i=0 ; i<strArray.length ; i++){  
  42.             System.out.println(strArray[i]+"\ti循环:"+i);  
  43.         }  
  44.         System.out.println(str +"\t --");  
  45.           
  46.         //这个构造函数从InputStream中加载Word文档。  
  47.         HWPFDocument doc = new HWPFDocument((InputStream)new FileInputStream("F:\\test.doc"));  
  48.           
  49.         //这个类为HWPF对象模型,对文档范围段操作  
  50.         Range range = doc.getRange(); //  
  51.           
  52.         //看看此文档有多少个段落  
  53.         int num = range.numParagraphs();  
  54.         System.out.println(num+"段");     
  55.           
  56.         //得到word数据流  
  57.         byte [] dataStream = doc.getDataStream();  
  58.         System.out.println("数据流长度:"+dataStream.length);  
  59.           
  60.         //用于在一段范围内获得段落数  
  61.         int numChar = range.numCharacterRuns();  
  62.         System.out.println("CharacterRuns 数:"+numChar);  
  63.            
  64.         //负责图像提取  和    确定一些文件某块是否包含嵌入的图像。  
  65.         PicturesTable table = new PicturesTable(doc, dataStream, null);  
  66.           
  67.         for(int j=0 ; j<numChar ; j++){  
  68.             //这个类表示一个文本运行,有着共同的属性。  
  69.             CharacterRun run = range.getCharacterRun(j);  
  70.             //是否存在图片  
  71.             boolean bool = table.hasPicture(run);  
  72.             System.out.println("是否存在图片:"+bool);  
  73.             if(bool){  
  74.                 //返回图片对象绑定到指定的CharacterRun  
  75.                 Picture pic = table.extractPicture(run, true);  
  76.                 //图片的内容字节写入到指定的输出流。  
  77.                 pic.writeImageContent(new FileOutputStream("F:\\"+j+".bmp"));  
  78.                 System.out.println("成功提取图片"+j+":");  
  79.             }  
  80.         }  
  81.         request.getRequestDispatcher("ok.jsp").forward(request, response);  
  82.     }  
  83.   
  84.   
  85. }  
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值