直接焊代码(这个代码写在2022-5-2)这道题比较简单,就是抓包-推断-完事
import requests
import time
import re
def main():
header_ = {
'Host': 'match.yuanrenxue.com',
'Connection': 'keep-alive',
'Content-Length': '0',
'Pragma': 'no-cache',
'Cache-Control': 'no-cache',
'sec-ch-ua': '"Google Chrome";v="95", "Chromium";v="95", ";Not A Brand";v="99"',
'sec-ch-ua-mobile': '?0',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/95.0.4638.10 Safari/537.36',
'sec-ch-ua-platform': '"Windows"',
'Accept': '*/*',
'Origin': 'https://match.yuanrenxue.com',
'Sec-Fetch-Site': 'same-origin',
'Sec-Fetch-Mode': 'cors',
'Sec-Fetch-Dest': 'empty',
'Referer': 'https://match.yuanrenxue.com/match/3'

这篇博客记录了在Python爬虫实践中遇到的一个关于Vary头的问题,探讨了Vary头在HTTP请求和响应中的作用,以及它如何影响缓存判断。作者还提到了Header排序对于请求的影响,指出不同写法可能会导致请求头顺序变化,这可能是反爬策略的一部分。此外,简单介绍了session和cookie的区别,强调理解cookie对于应对反爬的重要性。
最低0.47元/天 解锁文章
1571

被折叠的 条评论
为什么被折叠?



