博客专栏  >  云计算/大数据   >  网络爬虫进阶之路

网络爬虫进阶之路

网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

关注
5 已关注
3篇博文
  • 爬虫入门-03-12306官网登录详解

    爬虫入门-12306官网登录详解一,首先我们要先通过浏览器抓包的方式搞清楚登录的流程,url,参数等登陆=请求 POST请求 - 请求url(str) - 请求方式(str) - 参数(str,...

    2017-11-11 10:32
    98
  • 爬虫入门-02-爬虫模块介绍

    爬虫入门-爬虫模块介绍Python的urllib和urllib2模块都做与请求URL相关的操作,但他们提供不同的功能。 他们两个最显着的差异如下:   - urllib2可以接受一个Request...

    2017-11-10 09:49
    251
  • 爬虫入门-01-爬虫基础了解

    1.什么是爬虫爬虫,即网络爬虫,大家可以理解为在网络上爬行的一只蜘蛛,互联网就比作一张大网,而爬虫便是在这张网上爬来爬去的蜘蛛咯,如果它遇到资源,那么它就会抓取下来。想抓取什么?这个由你来控制它咯。 ...

    2017-11-09 09:19
    199
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部