poi把word2007转换为html,poi word2007转html

最新推荐文章于 2021-06-01 10:07:55 发布

杜佳加

最新推荐文章于 2021-06-01 10:07:55 发布

阅读量218

点赞数

文章标签： poi把word2007转换为html

该楼层疑似违规已被系统折叠隐藏此楼查看此楼

今天做POI解析word2007为html的时候，虽然已经转换到了html了，但是存在一个问题，那就是转换之后，表格中的内容从ASCII编码变为了unicode编码，具体代码如下：

实现转换的代码：

public class POIReadWordToHtml2007 {

public static void main(String[] args){

try {

File f = new File("C:\\Users\\Administrator\\Desktop\\wordAndExcel\\现场验收.docx");

if (!f.exists()) {

System.out.println("Sorry File does not Exists!");

} else {

if (f.getName().endsWith(".docx") || f.getName().endsWith(".DOCX")) {

// 1) Load DOCX into XWPFDocument

InputStream in = new FileInputStream(f);

XWPFDocument document = new XWPFDocument(in);

// 2) Prepare XHTML options (here we set the IURIResolver to

// load images from a "word/media" folder)

File imageFolderFile = new File("C:\\Users\\Administrator\\Desktop\\image");

XHTMLOptions options = XHTMLOptions.create().URIResolver(

new FileURIResolver(imageFolderFile));

options.setExtractor(new FileImageExtractor(imageFolderFile));

options.setIgnoreStylesIfUnused(false);

options.setFragment(true);

// 3) Convert XWPFDocument to XHTML

File file = new File("C:\\Users\\Administrator\\Desktop\\现场验收.html");

OutputStream out = new FileOutputStream(file);

XHTMLConverter.getInstance().convert(document, out, options);

BufferedReader in1 = new BufferedReader(new FileReader("C:\\Users\\Administrator\\Desktop\\现场验收.html"));

String str;

while ((str = in1.readLine()) != null)

{

System.out.println(str);

}

in1.close();

// file.delete();

} else {

System.out.println("Enter only MS Office 2007+ files");

}

}

} catch (Exception e) {

e.printStackTrace();

}

}

转换后的部分html代码：

【题干】

ewqeqwe

导入的习题＿你好

【选项】

【无】

【答案】

1111

【解析】

解析法大法师法

【结束】

其中的【就是我需要的内容，但是不知道怎么的就被转换为了这种编码的内容了，浏览器能够正确的解析这种编码的内容。

跪求大神告知如何修改！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
poi把word2007转换为html,poi word2007转html

该楼层疑似违规已被系统折叠隐藏此楼查看此楼今天做POI解析word2007为html的时候，虽然已经转换到了html了，但是存在一个问题，那就是转换之后，表格中的内容从ASCII编码变为了unicode编码，具体代码如下：实现转换的代码：public class POIReadWordToHtml2007 {public static void main(String[] args){try {...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。