- 博客(2)
- 收藏
- 关注
原创 httpclient 4.0读到的网页乱码问题
<br />用了httpclient写了一个抓取网页源码的代码,抓取的sina博文很正常,但是163的确全是乱码,折腾了一天终于搞定,结果真是让人哭笑不得。<br /> <br />一开始怀疑字符编码设置的不对,分别设了utf,gb2312,gbk都没有作用,在看了一下乱码,里面没有一个字符能认得出,如果是字符编码的问题,起码英文应该不会是乱码吧。<br /> <br />然后就觉得是不是httpclient的问题,查了很多资料都没有答案,而且网上httpclient4.0的也很少,大部分都是3。0的代码。
2010-12-12 20:55:00
1371
原创 getNodeValue()取不到值
<br />今天用java的dom写了一个读取xml文件的小程序。发现node.getNodeValue()方法怎么都取不到值,全是null.<br /> <br />分析了一下,程序里node的属性值是正确的,排除了xml格式错误的可能性。<br /> <br />node的名称也是正确的,也就是说错误已经明确了,就是取不到值,真是奇怪。<br /> <br />google了一下,发现在getNodeValue()前面都有一个getFirstChild(),难道是这个node的值是作为它的一个字节点存在
2010-12-04 23:27:00
2392
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人