- 博客(2)
- 资源 (8)
- 收藏
- 关注
原创 WebPage类的源代码
这是我在MySOSO项目中用于抓取和分析网页的类。主要功能有:1、提取网页的纯文本,去所有html标签和javascript代码2、提取网页的链接,包括href和frame及iframe3、提取网页的title等(其它的标签可依此类推,正则是一样的)4、可以实现简单的表单提交及cookie保存/** Author:Sunjoy at CCNU* 如果您改进了这个类请发一份代码给我(ccnu
2006-05-30 13:11:00 4207 9
原创 python的确是个好工具
最近研究了一下Python,觉得他这种问答式的界面特别适合学习编程,下面就举两个例子。1.快速排序的算法描述>>> def qsort(aL):... if aL==[]:return []... else:... smaller=[x for x in aL[1:] if x... bigger=[x for x in aL[1:] if x>=aL[0]] #比aL[0]大(或相等
2006-05-29 22:28:00 3720 3
QRe 正则表达式测试工具
2008-01-05
小孙Java反编译专家2.0
2007-08-16
IceSword终结者
2007-04-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人