python-爬虫
文章平均质量分 81
fei2636
这个作者很懒,什么都没留下…
展开
-
关于反爬虫,看这一篇就够了
你被爬虫侵扰过么?当你看到“爬虫”两个字的时候,是不是已经有点血脉贲张的感觉了?千万要忍耐,稍稍做点什么,就可以在名义上让他们胜利,实际上让他们受损失。 一、为什么要反爬虫 1、爬虫占总PV比例较高,这样浪费钱(尤其是三月份爬虫)。 三月份爬虫是个什么概念呢?每年的三月份我们会迎接一次爬虫高峰期。 最初我们百思不得其解。直到有一次,四月份的时候,我们删除了一个url,然后有转载 2018-01-16 10:43:11 · 397 阅读 · 0 评论 -
Scrapy 框架
Scrapy 框架 Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架,用途非常广泛。 框架的力量,用户只需要定制开发几个模块就可以轻松的实现一个爬虫,用来抓取网页内容以及各种图片,非常之方便。 Scrapy 使用了 Twisted['twɪstɪd](其主要对手是Tornado)异步网络框架来处理网络通讯,可以加快我们的下载速转载 2018-01-17 08:25:19 · 387 阅读 · 0 评论