首先要说明,过程中出了问题.
1 文件头. doc 它比较特殊,它会在开头生成一段文件,具体作用不清楚.这是我们新建完 doc 大小 26 kB 的原因.
2 特殊内容. doc 属于富文本.它包括表格,图片等内容.
这些是相当的麻烦.网上找了很多,但大都很浅.这里只能省浅浅的说一下.
http://poi.apache.org/download.html 在这里可以下载到 POI 的jar 包.
这里我只用到两个
poi-scratchpad-3.5-FINAL-20090928.jar
poi-3.5-FINAL-20090928.jar
package com.isw2.doc.test;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import org.apache.poi.hwpf.extractor.WordExtractor;
import org.apache.poi.hwpf.model.io.HWPFOutputStream;
public class TestDoc {
public static void main(String[] args) {
readDocPOI("C:/test/test.doc");
writeDocPOI("C:/test/test.doc", "test doc ,google");
}
/**
* 仅适合读取纯属 文本 信息
*
* @param docPath
*/
public static void readDocPOI(String docPath) {
try {
InputStream inputStrem = new FileInputStream(docPath);
WordExtractor extractor = new WordExtractor(inputStrem);
inputStrem.close();
System.out.println(extractor.getText());
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
/**
* 写入 doc 文件(这里如果文件存在就追加,如果不存在就新建因为没有加文件头,readDocPOI 无法读取)格
* 式无法设置
*
* @param docPath
* @param context
*/
public static void writeDocPOI(String docPath, String context) {
try {
OutputStream outputStream = new FileOutputStream(docPath, true);
byte[] byteArr = context.getBytes();
HWPFOutputStream houtputStream = new HWPFOutputStream();
houtputStream.write(byteArr, 0, byteArr.length);
houtputStream.writeTo(outputStream);
houtputStream.close();
outputStream.close();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
}
本来是打算写一个程序,把 doc 转换成 pdf 格式.在这里了问题.开始的两个问题没能解决.
还有一种方式 jacob 方式.它也可以.效果很好.但它实际上是依赖 Word 的,它会调用 Word.这就意味着电脑上一定要有 Word .而 Linux 上无法运行.