令人羞耻的中国流氓搜索爬虫

众所周知,国内的搜索引擎爬虫是恶名昭著的,不遵守行业规则,不尊重robots.txt的规定,其疯狂的爬网页行为对缺乏安全抵抗机制的中小互联网站往往是灭顶之灾。

就是JavaEye网站也时不时遭受流氓爬虫的困扰,流氓爬虫包括了百度,雅虎中国等所谓的大公司。至于名气稍小一点的爬虫,那就更加肆无忌惮了。JavaEye网站曾经连续封杀了两个C类IP地址段以杜绝其流氓行径。

但是没有想到啊,中国的流氓爬虫已经把黑手伸向了国外,恶名已经扬名在外了。

当我今天访问Progmatic Programmers的网站,却看到了如下信息:

http://media.pragprog.com/titles/rails2/code/depot_c/public/images

[quote]We're sorry, but access is denied to that document.

This might be because [color=red]you are accessing this site from a machine in China. Because of a massive amount of robot traffic from Chinese machines, we've had to take the unfortunate step of blocking access from those IPs[/color].

If you feel that access has been denied in error, please contact our support folks.[/quote]

大意如下:

[color=red]对不起,你无权访问这个页面,因为你是从中国访问的。由于大量来自中国的爬虫程序导致的网站负载,我们不得不遗憾的封锁来自中国的IP地址。[/color]

看了这段话,真让人羞耻,中国的流氓爬虫已经连累了整个中国地区的IP地址段,造成了恶劣的国际影响。长此以往,要是国外的技术网站联手统统封杀中国的IP地址段,那将是何等的恶果啊。

真的应该到了讨伐流氓爬虫的时候了!
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值