- 博客(2)
- 收藏
- 关注
原创 xpath在HTML解析中的应用(加强版)
经过一番研究以后才发现原来libxml2其实已经内置了对HTML的解析——即使是不很规范的HTML。所以上篇《xpath在XHTML解析中的应用》完全是我学艺不精的产物。囧不过好处是顺便学习到了j7a7c7k7兄推荐的tidy(用的是令狐提供的µTidylib),这也是个好东东。现在来看如何直接使用lxml(即前文说过的libxml2的一个python binding)处理那个
2009-09-03 17:52:00
24187
3
原创 第三届CSDN英雄会上海站
时间过得真快,转眼又是一年英雄会。上半年的北京站没有去,因为一年不如一年——今年连门票都没有,所以又少了一次诅咒绿毛龟的机会。中国邮政现在的作用就是寄明信片(须穿墙)。总算是还能赶上上海站的英雄会,用的是EMAIL+手机短信的双重电子门票,这倒是挺环保的一个做法——还挺省钱。看来经济危机对CSDN的影响还是很大的,于是去年同行的令狐和三火今年都因为没票而没来,到了会场看到的参会
2009-09-01 10:26:00
3101
7
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人