问题?POI解析03版07版Excel表,解析.xls和.xlsx表案例 POI解析
一、03版和07版Excel表在存储上有什么区别?
我们首先要知道office2007和2003的区别,07版本的在windows操作系统下面用解压软件可以打开,发现里面是多.xml文件!如.docx的word文档打开过后可以看到word/document.xml这个文件,打开这个文件,里面是xml格式的代码,你会发现,所有的最原始的文字都在这里面,这就是我们需要的,而其他什么格式啊,样式啊都有。
但是这都是无关紧要的,主要是提取出文字信息!既然是.xml格式的,那我们又必须要解析.xml
同样的分析方法,都打开pptx和xlsx,你也会存储文字信息的xml文件,在用同样的方法就可以解决啦!只是ptx是每一页,就是每一个slide是一个xml,你的ppt有多少页,就会有多少个slide.xml,需要做一些步骤罢了。不过思想都是一样。
而03版的Excel主要是二进制流存储的,所以相对来说解析的方式会有所不同。
03版的是.XLS,07以后的都是.XLSX
二、POI方式解析
1.jar下载官网:点击官网链接 下载类型poi-bin-3.15-beta1.tar格式
2.本人下载好的jar包及案例:点击下载链接
3.