在爬虫中 也许会遇到一些问题 比如网站不是安全连接
#coding=utf-8
import requests
url = 'https://sam.huat.edu.cn:8443/selfservice/' #这里找一个无法直接安全进入的网页
resp = requests.get(url).content
print(resp)
访问的时候会发现 SSL证书问题无法进入:
cerify=False虽然可以跳过安全认证,也就是不验证证书的可靠性,直接请求。但是这其实是不安全的,因为证书可以伪造,不验证的话就不能保证数据的真实性。
#coding=utf-8
import requests
url = 'https://sam.huat.edu.cn:8443/selfservice/' #这里找一个无法直接安全进入的网页
resp = requests.get(url,verify=False).content #这里直接cerify=False 跳过证书就好了
print(resp)
InsecureRequestWarning(不安全的请求警告)
官方强制https的安全证书
解决方法:
urllib3.disable_warnings()
完整的代码:(仅供参考)
#coding=utf-8
import requests
import urllib3
url = 'https://sam.huat.edu.cn:8443/selfservice/'
urllib3.disable_warnings()
resp = requests.get(url,verify=False).content
print(resp)
代码就不会报错了
对了有的源码解码不一定是utf-8哦 有可能是GBK