爬取数据时，HTTP ERROR 401解决办法

非浪得虚名

已于 2024-04-15 20:16:30 修改

阅读量366

点赞数 14

文章标签： http 网络协议网络

于 2024-04-15 14:48:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41476714/article/details/137780695

版权

文章目录

爬取数据时，HTTP ERROR 401解决办法
- - 一、添加Authorization字段
  - 二、JS逆向

爬取数据时，HTTP ERROR 401解决办法

在爬取网页数据时，遇到这样一个问题：

浏览器能可以浏览的网页，按F12后，打开network，找到数据所在的链接，双击（或者将header中的Request URL复制粘贴到浏览器地址栏），发现报了401的错误。

在这里插入图片描述

这个问题的原因是网站做了反爬机制。有两种解决思路。

一、添加Authorization字段

在爬虫代码请求URL时，在请求头header中添加Authorization字段，从浏览器中拷贝该字段的值。

在这里插入图片描述

在这里插入图片描述

注意，该方法是临时的。当重新登陆时，Authorization会重置，这时需要再次拷贝该值到代码中。

二、JS逆向

这种方法需要对该网页的js代码进行分析，找出产生密钥的token，并在代码中模拟生成这个token。由于这个过程稍微有些复杂，对于不同的网站，都需要一步步去做逆向。感兴趣的小伙伴可以深入了解下。

这种方法不是临时的，重新登陆后仍然有效。

综上，介绍了两种解决401问题的方法。如果只是临时爬一下数据，用第一种方法更简便。如果要多次爬取数据，采用js逆向方法来解决。

非浪得虚名

关注

14
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
爬取数据时，HTTP ERROR 401解决办法

在爬取网页数据时，遇到这样一个问题：浏览器能整成浏览，按F12，打开network，找到数据所在的链接，双击（或者将header中的Request URL复制粘贴到浏览器地址栏），发现报了401的错误。
复制链接

扫一扫

非浪得虚名

博客等级

码龄6年

18
原创

83
点赞

96
收藏

69
粉丝

关注

私信

热门文章

分类专栏

Java体系学习 1篇
环境安装问题

最新评论

爬取数据时，HTTP ERROR 401解决办法
CSDN-Ada助手: 恭喜您写了第16篇博客！解决HTTP ERROR 401的问题对于数据爬取来说确实是一个重要的技巧。接下来，我建议您可以尝试探讨更多关于数据爬取过程中可能遇到的其他常见错误及解决方法，这样能够帮助更多人更好地应对类似情况。期待您的下一篇作品！祝您创作顺利！
特征工程-特征提取
CSDN-Ada助手: 恭喜用户撰写了第15篇博客《特征工程-特征提取》，内容相信对读者们会有很大的帮助。在特征工程这个领域里，特征提取是非常重要的一环，你的文章对于这一部分的深入探讨无疑是非常有价值的。希望你能够继续保持创作的热情，不断学习和探索，也可以考虑结合实际案例或者应用场景来进行更深入的分析，这样读者们会更容易理解和接受你的观点。期待你未来更多精彩的创作！愿你在探索特征工程领域的道路上越走越远，越走越宽广！
使用wkhtmltopdf包将html转pdf的时候，图片不显示问题
CSDN-Ada助手: 恭喜您发布了第14篇博客！看到您分享关于使用wkhtmltopdf包转换html到pdf时遇到的图片显示问题，感觉收获颇丰。或许下一步可以尝试探索其他PDF转换工具，或者深入研究解决图片显示问题的更多方法，期待您的进一步探索和分享。希望您能继续保持创作的热情，谦虚虚心地学习与分享！
软件工程之数据类项目开发
阿J~: 大佬，一给我嘞giao
Push时出现“[email protected]: Permission denied (publickey).”
water___Wang: 学习了

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。