爬虫与反爬虫与反反爬虫简介

最新推荐文章于 2020-09-03 18:18:00 发布

weixin_33847182

最新推荐文章于 2020-09-03 18:18:00 发布

阅读量171

点赞数

文章标签：爬虫

原文链接：http://www.cnblogs.com/lyq-biu/p/9742508.html

版权

一.基本概念简介

　　1.爬虫：

　　　　　　自动获取网站数据的程序，关键是批量的获取。

　　2.反爬虫：

　　　　　　使用技术手段防止爬虫程序的方法。

　　3.误伤：

　　　　　　反爬技术将普通用户识别为爬虫，如果误伤过高，效果再好也不能用。（如局域网【学校，网吧等】可能用的是同一个ip，如果有人写了一个爬虫，把ip封了，可能损失很多用户。还有可能ip动态分配，重启路由器ip很有可能切换，而被禁的ip有可能在其他用户那儿。）

　　4.拦截：

　　　　　　成功拦截爬虫，一般拦截率越高，误伤率越高。

二.反爬虫的目的

　　1.初级爬虫：

　　　　　　简单暴力，不管服务器压力，容易弄垮网站。

　　2.数据保护：

　　　　　　保护数据不被窃取。

　　3.失控爬虫：

　　　　　　由于某些情况忘记或无法关闭的爬虫。

　　4.商业竞争对手：

　　　　　　行业间竞争窃取数据。

三.爬虫与反爬虫对抗过程

　　

转载于:https://www.cnblogs.com/lyq-biu/p/9742508.html

weixin_33847182

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
爬虫与反爬虫与反反爬虫简介

一.基本概念简介　　1.爬虫：　　　　　　自动获取网站数据的程序，关键是批量的获取。　　2.反爬虫：　　　　　　使用技术手段防止爬虫程序的方法。　　3.误伤：　　　　　　反爬技术将普通用户识别为爬虫，如果误伤过高，效果再好也不能用。（如局域网【学校，网吧等】可能用的是同一个ip，如果有人写了一个爬虫，把ip封了，可能损失很多用户。还有可能ip动态分配，重启路由器ip很有可能...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。