2021-11-15爬虫第三天身份认证

Kingandbey

已于 2022-01-20 13:33:59 修改

阅读量2.2k

点赞数

分类专栏： Python爬虫文章标签： https 安全 http

于 2021-11-15 15:33:32 首次发布

本文链接：https://blog.csdn.net/qq_45802978/article/details/121331308

版权

Python爬虫专栏收录该内容

2 篇文章 0 订阅

订阅专栏

爬虫第三天身份认证

ssl验证
代理设置
超时设置
身份认证
1）基本身份认证
2）摘要式身份认证
总结

一、ssl验证

import requests
response=requests.get('https://www.12306.cn/index/')
print(response.status_code)

在这里插入图片描述

在这里插入图片描述

模仿

设置忽略警告的方式屏蔽警告

import requests
from requests.packages import urllib3
urllib3.disable_warnings()
response=requests.get('http://www.baidu.com',verify=False)
print(response.status_code)

在这里插入图片描述
捕获警告到日志的方式忽略警告

import logging
import requests
logging.captureWarnings(True)
response=requests.get('https://baidu.com',verify=False)
print(response.status_code)

在这里插入图片描述

二、代理设置

设置代理解决问题：对大规模且频繁的请求网站可能会弹出验证码，或者跳转到登录认证界面，更甚者可能会直接封禁客户端的ip，导致一定时间内无法访问。

代理无效
在这里插入图片描述
网上找了一个免费爬代理IP的

【Python脚本】-Python查找可用代理IP

出现错误
在这里插入图片描述
解决：

python异常错误：SyntaxError: Missing parentheses in call to ‘print’

然后出现了抛出异常
在这里插入图片描述
解决：

Python异常处理 -跳过异常继续执行（参考异常的语法）

出现了新的问题
在这里插入图片描述
注释掉这句话后成功运行，可惜就是没有IP

安装socks协议，requests支持socks协议的代理

无语了，手打也能出现错误

Python对代码这方面的排版真的很严格。

在这里插入图片描述

三、超时设置

在这里插入图片描述

永久等待——不加参数，或者把timeout的参数设置为none

四、身份认证

1)基本身份认证
requests自带身份认证，但还是可能会报ssl错误
在这里插入图片描述
解决：加上ssl验证

import requests
from requests.auth import HTTPBasicAuth
r=requests.get('http://static3.scrape.cuiqingcai.com',auth=HTTPBasicAuth('admin','admin'),verify=False)
print(r.status_code)

在这里插入图片描述
代码可以简写

import requests
from requests.auth import HTTPBasicAuth
r=requests.get('http://static3.scrape.cuiqingcai.com',auth=('admin','admin'),verify=False)
print(r.status_code)

在这里插入图片描述
2）摘要式身份认证——Digest Authentication

五、总结

多学习Python基础，在排版这方面真的太严格了

Kingandbey

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-11-15爬虫第三天身份认证

**爬虫第三天身份认证**ssl验证代理设置超时设置身份认证1）基本身份认证2）摘要式身份认证总结一、ssl验证import requestsresponse=requests.get('https://www.12306.cn/index/')print(response.status_code)模仿设置忽略警告的方式屏蔽警告import requestsfrom requests.packages import urllib3urllib3.disa
复制链接

扫一扫