poi 顺序解析word_用poi解析word 总结

1. 获得word的文本内容 无任何格式 样式 图片

try{

FileInputStream fis = new FileInputStream(new File("F://test.doc"));

WordExtractor ex = new WordExtractor(fis);

String text2003 = ex.getText();

System.out.println("word的内容信息"+text2003);

} catch (Exception e) {

e.printStackTrace();

System.out.println("解析word有错!");

}

2. 获得word的段落

File file = new File("F://test.doc");

try {

FileInputStream fis = new FileInputStream(file);

WordExtractor wordExtractor = new WordExtractor(fis);

StringBuffer sb = new StringBuffer();

System.out.println("【 使用getText()方法提取的Word文件的内容如下所示:】");

String[] paragraph = wordExtractor.getParagraphText();

System.out.println("该Word文件共有"+paragraph.length+"段。");

for(int i=0;i&ltparagraph.length;i++){

System.out.println("&lt 第 "+(i+1)+" 段的内容为 &gt");

System.out.println(paragraph[i]);

if(i==0){

sb.append("&ltcenter&gt");

sb.append(paragraph[i]);

sb.append("&lt/center&gt&ltbr&gt");

}

else{

sb.append("    ");

sb.append(paragraph[i]);

System.out.println(paragraph[i].hashCode());

sb.append("&ltbr&gt");

}

}

System.out.println(sb.toString());

} catch (FileNotFoundException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

3.取得word内容的字体样式(只能一个一个字符的取字体的样式 效率将是一个大问题)

File file = new File("F://test.doc");

try {

int flg = 0;

String str="";

FileInputStream fis = new FileInputStream(file);

HWPFDocument doc = new HWPFDocument(fis);

StringBuffer sb = new StringBuffer();

sb.append("&ltcenter&gt");

int length = doc.characterLength();

for(int m =0;m&ltlength-1;m++){

Range range = new Range(m,m+1,doc);

for(int j=0;j&ltrange.numCharacterRuns();j++){

CharacterRun cr=range.getCharacterRun(j);

System.out.println(cr.getPicOffset()+" "+cr.getColor()+" "+cr.getFontName()+" "+cr.getFontSize()+" ");

if(range.text().hashCode() != 13){

sb.append("&ltfont color='");

sb.append(cr.getColor());

sb.append("' style='font-size:");

sb.append(cr.getFontSize());

sb.append("pt;font-family:");

sb.append(cr.getFontName());

sb.append("'&gt");

sb.append(range.text());

sb.append("&lt/font&gt");

//str = str + "&ltfont color='"+cr.getColor()+"' style='font-size:"+cr.getFontSize()+"pt;font-family:"+cr.getFontName()+"'&gt"+range.text()+"&lt/font&gt";

}

else{

if(flg == 0){

sb.append("&lt/center&gt&ltbr&gt    ");//

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值