![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 91
是白白
啊,这为啥不能运行?啊,这为啥也能运行?
展开
-
selenium+opencv处理滑块验证码
测试时间:2021年11月7日大家做爬虫的时候肯定会遇到很多验证码列如本文所指的图像识别:小伙伴们我讲的可能会比较啰嗦,还希望你们不要嫌弃这次以顺丰官网查询快递为例:运单追踪 (sf-express.com)https://www.sf-express.com/cn/sc/dynamic_function/waybill/滑块验证码会在输入快递单号点击查询之后弹出来,这里我们已经为大家准备了一个假的运单号供测试使用嘿嘿嘿 SF1300477886754我们现在要做的呢就是...原创 2021-11-11 21:23:37 · 5436 阅读 · 6 评论 -
selenium获取cookie并携带模拟登录
前言:有小伙伴可能会觉得明明F12在开发者选项里面就能获取到cookie信息为啥还要专门写一个程序去获取,这不多此一举嘛其实并不是哟,首先呢一般你直接登录之后得cookie信息都是不完整得只有一条而且大部分都是加密过得,哪怕我们假设它是完整得你直接复制之后selenium也接受不了,因为直接复制得格式不是selenium要求的你再去转换格式不得很麻烦呀不多废话哈切入正题,这次测试得目标网站为QQ空间 https://mail.qq.com/1、获取cookie信息先定义前面...原创 2021-11-06 20:12:18 · 4038 阅读 · 0 评论 -
关于爬虫反爬机制处理方法(整合)
常见得反爬机制及解决办法1、针对请求头做出得反爬简介:网站通过去检查headers中的User-Agent字段来反爬,如果我们没有设置请求头,那么headers默认是python这样就会出现访问失败、没有权限等原因,如果去伪造一个请求头是可以避开得,不过如果短时间内频繁使用同一个User-Agent访问可能会被检测出来导致被封掉爬虫解决办法:通过fake_useragent构造随机请求头第一步:下载fake_useragent可以直接在cmd当中输入:pip install..原创 2021-11-11 21:43:29 · 5700 阅读 · 0 评论