public void characters(char ch[],int start,int length)throws SAXException
in ContentHandler interface:
关于参数ch的解释:
String s = new String(ch,start,length)
并不一定就能完整的表示 元素的值. 如果xml文档交长, 有可能一个元素的值会被分两次读入,所以如果只适用上面的方法去获得元素的值,很可能得到的不完整的数据.
原因:
SAX parser 分块读取流, 默认为一次读取2K字节. (ch 里面不仅包含元素的值信息,其实它是整个xml文档的一个部分,也就是说,分析器每次从文档中读取2K字节,放到这个数组中,然后通过start和length来划分出属于value的部分.这样的话,不能保证最后一个元素的值是完全被包含在这个ch中的).
所以我们还是要进行一些额外的操作才能通过 characters(char ch[],int start,int length)获得完整的element value.
Parser每次读取2K字节去填充ch. 填充顺序是从开头到结尾来覆盖原有的值, 所以在最后一次读取文档的时候,可能剩余部分不足2K,所以就会出现ch 中,前半部分是 文档的末尾部分, 而ch后半部分还有多余的信息,这个是倒数第二个ch中未被覆盖掉的部分。