说明:将指定目录下的doc文档转为文本格式。
代码如下:
import java.io.BufferedWriter;
import java.io.File;import java.io.FileInputStream;
import java.io.FileWriter;
import org.textmining.text.extraction.WordExtractor;
/**
* 测试将指定目录下的doc转换为txt
* */
public class DocToTxt {
public static void main(String[] args) {
String src = "E:/Test";
String dest = "E:/Test";
wordToTxt(src, dest);
}
public static void wordToTxt(String src, String dest) {
File dir = new File(src);
File[] files = dir.listFiles();
int i = 0;
for (File file : files) { // 遍历指定目录
try {
toTxt(file, dest);
i++;
} catch (Exception e) { <