Python爬虫
ninesun127
有一个目标,总能让我们欢欣鼓舞~
展开
-
[Python]网络爬虫(一):抓取网页的含义和URL基本构成
本博客转载 于 请叫我汪海的爬虫博客。感谢。 一、网络爬虫的定义 网络爬虫,即Web Spider,是一个很形象的名字。 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。 网络蜘蛛是通过网页的链接地址来寻找网页的。 从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址, 然后通过这些链接地址寻找下转载 2016-11-07 20:00:06 · 479 阅读 · 0 评论 -
[Python]网络爬虫(二):利用urllib2通过指定的URL抓取网页内容
本博客转载于请叫我汪海的csdn博客,万分感谢。 http://blog.csdn.net/pleasecallmewhy/article/details/8923067 版本号:Python2.7.5,Python3改动较大,各位另寻教程。 编辑器:IDLE,notepad++ 所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。转载 2016-11-07 20:02:44 · 582 阅读 · 0 评论 -
[Python]网络爬虫(三):异常的处理和HTTP状态码的分类
[Python]网络爬虫(三):异常的处理和HTTP状态码的分类转载 2016-11-25 09:41:59 · 225 阅读 · 0 评论