用python爬虫抓站的一些技巧总结

这些脚本有一个共性,都是和web相关的,总要用到获取链接的一些方法,再加上simplecd这 个半爬虫半网站的项目,累积不少爬虫抓站的经验,在此总结一下,那么以后做东西也就不用重复劳动了。   - 1.最基本的抓站 import urllib2 content = urlli...

2012-05-14 17:28:30

阅读数:874

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭