之前一直都是使用dom4j来处理XML文件,比较方便,就好像使用htmlcleaner来处理html文件一样。
但dom4j解析xml文件有一个缺点,就是它需要加载整个文件,才能处理。对于大的XML文件 ,全部加载到内存并生成相应的结构时,40M的文件 进入内存需要消耗300多M的内存,性能极差。
后面使用SAX来解析大的XML文件,性能得到很大的提升。主要的实现代码如下:
之前一直都是使用dom4j来处理XML文件,比较方便,就好像使用htmlcleaner来处理html文件一样。
但dom4j解析xml文件有一个缺点,就是它需要加载整个文件,才能处理。对于大的XML文件 ,全部加载到内存并生成相应的结构时,40M的文件 进入内存需要消耗300多M的内存,性能极差。
后面使用SAX来解析大的XML文件,性能得到很大的提升。主要的实现代码如下: