场景:因要处理大量行业数据每个(大部分)单个项目文件中包含一份文档说明部分是txt,另外大部分是doc/docx.
通过 百度得到需要poi方式 读取。
大体是参考此处博主文章:
https://blog.csdn.net/qq_36243824/article/details/71643193
1.下载配置poi的jar。
下载后解压,如图:
image.png
2.编写代码
把这6个poi开头的jar 包导入新建的测试空项目,写如下代码:
public static String getPhoneNum(File filePath) {
String text = "";
String fileName = filePath.getName().toLowerCase();// 得到名字小写
try {
FileInputStream in = new FileInputStream(filePath);
if (fileName.endsWith(".doc")) { // doc为后缀的
WordExtractor extractor = new WordExtractor(in);
text = extractor.getText();
}
if (fileName.endsWith(".docx")) {