pythonSSL证书 cookie session

本文介绍了Python爬虫中遇到的SSL证书问题,如何利用Cookie反反爬,解决网页数据通过Ajax加载的情况。通过添加Cookie成功获取到车次和票务信息,同时探讨了使用Session保持会话状态,以及处理验证码图片的方法。
摘要由CSDN通过智能技术生成

SSL证书

在这里插入图片描述

Cookie

在这里插入图片描述

import requests
# url ='https://inv-veri.chinatax.gov.cn'
headers=headers = {
   
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.104 Safari/537.36'}
# res =requests.get(url,headers=headers,verify=False)
# print(res.text)
url ='http://www.renren.com/974676254/profile'# 个人主界面
res =requests.get(url,headers=headers) #获取响应对象
# html = res.text
with open('rr.html','w',encoding='utf-8')as f:
        f.write(res.text)

在这里插入图片描述
## 添加cookie就可以

import requests
# url ='https://inv-veri.chinatax.gov.cn'
headers=headers = {
   
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.104 Safari/537.36','Cookie':'anonymid=knuah4rlg19q8v; depovince=GUZ; jebecookies=9fa66178-66e2-4a23-b530-4e9c627e6273|||||; _r01_=1; JSESSIONID=abcLTfJ0P4Oov_4lYS_Jx; ick_login=7ca72789-831c-4f66-a502-c49190fe2c46; taihe_bi_sdk_uid=68327472d5a51ad2df417dfe0cdc315f; taihe_bi_sdk_session=4fc61b70afef852aca6587d8a70ef277'}
# res =requests.get(url,headers=headers,verify=False)
# print(res.text)
url ='http://www.renren.com/974676254/profile'# 个人主界面
res =requests.get(url,headers=headers) #获取响应对象
# html = res.text
with open('rr.html','w',encoding='utf-8')as f:
        f.write(res.text)

在这里插入图片描述

cookie–反反爬

在这里插入图片描述

网页看到数据,源代码没有——ajax

在这里插入图片描述

解决

在这里插入图片描述
在这里插入图片描述

数据找到了:

在这里插入图片描述

被反爬了

def query():
        headers = {
   
                'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.104 Safari/537.36'}
        res =requests.get('https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2021-04-26&leftTicketDTO.from_station=CSQ&leftTicketDTO.to_station=BJP&purpose_codes=ADULT',headers=headers)
        print(res.content.decode('utf-8'))
query()

在这里插入图片描述

解决——加cookie

在这里插入图片描述
在这里插入图片描述

找到了车次[3]和有无票[23]

在这里插入图片描述

def query()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值