爬虫---反反爬---headers

最新推荐文章于 2024-07-24 10:39:56 发布

agsddd

最新推荐文章于 2024-07-24 10:39:56 发布

阅读量979

点赞数

分类专栏：爬虫开发爬虫开发历程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41245276/article/details/87531372

版权

爬虫开发同时被 2 个专栏收录

46 篇文章 0 订阅

订阅专栏

爬虫开发历程

20 篇文章 0 订阅

订阅专栏

1.一般可直接全复制进去

2.部分网站放入部分参数才可以，全部放进去反而获取不到理想页面,比较重要的3个:UA,Cookie,Referer。

3：可用pycharm正则处理复制过来的headers,也可写脚本处理。

其他参数的解释：

Connection：链接类型 keep-alive 支持使用长连接，复用上次连接，因为有三次握手，四次挥手消耗时间，不断开连接，直接使用上次的连接
Upgrade-Insecure-Requests：浏览器http升级为HTTPS请求，告诉服务器，自己支持这种操作，也就是我能读懂你服务器发过来的上面这条信息
Accept：传输文件类型，浏览器接受什么数据 q 是权重，体现执行的先后
Referer：页面跳转处，标识当前url地址是哪里过来的
Accept-Encoding：文件编解码格式，压缩方式，文件压缩传输增快
x-requested-with :XMLHttpRequest：是Ajax 异步请求

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。