- 目录
- 1.解决思路
- 2.导入的包
- 3.安装环境
- 4.代码
- 5.后续
1.解决思路
最开始思路是使用POI,因为常见的解析文档的格式是excel,用的就是POI。但是在网上找了两天别人分享的方法POI没有一个可以实现的,最后老大给了一个思路是先转将Word文档转为HTML文件,再来解析HTML文件,事实证明是可行的。
2.导入的包
jacob.jar、jsoup-1.12.1.jar
3.安装环境
1.用jacob. 先到官方网站上去下载:http://sourceforge.net/project/showfiles.php?group_id=109543&am