Scrapy遇到http状态码521：Crawled (521)的解决方案

你的老师父

已于 2023-08-06 15:45:17 修改

阅读量1.5k

点赞数

分类专栏： android实战文章标签： scrapy http 网络协议

于 2023-07-20 18:31:52 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/haozening/article/details/131837249

版权

android实战专栏收录该内容

10 篇文章 5 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

文章目录

问题
问题分析
解决方案

大家好，我是专职Android研发，有14年研发经验，其中Android研发经验已经有10年。
曾任职上市公司，有车机导航、机器人等行业及研发经验，热衷于技术和研发。
除Android专业外，也研究并使用Python、PHP、JavaScript、前端、中间件、数据库等技术。
目前开始通过博客对自己的知识和经验进行归纳和总结，由于工作较忙，不定期去更新博客。
希望本博客的内容能够真正帮助到一些同学。
个人博客： Dzboy的日志

问题

最近在使用Scrapy，遇到了http status 521状态码：
DEBUG: Crawled (521) <GET https://xxx/xxx/xxx> (referer: None)
导致网站数据获取不到。

问题分析

这是因为网站的反爬机制：当第一次访问该站，都会弹出一个521的错误状态码，同时Response Header中携带一个Set-Cookie，会通过Set-Cookie返回一个Cookie。
浏览器接受到状态码与Cookie，会再次进行一次请求，这时会在Request Header的Cookie中携带Response Header中携带一个Set-Cookie的值，这样就请求成功了。

解决方案

使用Scrapy的话，可以走UA的方式，只需要配置一下就可以了，非常方便：

如果访问的网站地址是这个 https://xxx

了解本专栏

超级会员免费看

你的老师父

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Scrapy遇到http状态码521：Crawled (521)的解决方案

大家好，我是专职Android研发，有14年研发经验，其中Android研发经验已经有10年。曾任职上市公司，有车机导航、机器人等行业及研发经验，热衷于技术和研发。除Android专业外，也研究并使用Python、PHP、JavaScript、前端、中间件、数据库等技术。目前开始通过博客对自己的知识和经验进行归纳和总结，由于工作较忙，不定期去更新博客。希望本博客的内容能够真正帮助到一些同学。
复制链接

扫一扫

专栏目录

你的老师父 CSDN认证博客专家 CSDN认证企业博客

码龄15年

11: 原创

39万+: 周排名

174万+: 总排名

3万+: 访问

: 等级

244: 积分

23: 粉丝

4: 获赞

7: 评论

9: 收藏

私信

关注

热门文章

分类专栏

android实战付费 10篇
php 2篇

最新评论

android技巧：dumpsys简化信息查看Activity结构
尹先生y: 请问dump出来的信息，在android开发中是通过哪些接口可以获取到的吗？比如：您截图中显示了，displayID=0这块屏幕上TaskRecord中的应用包名为com.craaaaazy.test3这个应用。请问在代码中如何查找某块display和该屏幕上正在运行的应用的包名呢？非常期待您的回答，谢谢！
RecyclerView.scrollToPosition滚动无效、跳动问题
CSDN-Ada助手: 恭喜您写了第5篇博客！标题“RecyclerView.scrollToPosition滚动无效、跳动问题”引起了我的兴趣。在这篇博客中，您讨论了RecyclerView在滚动时出现无效和跳动的问题。我很高兴看到您发现了这个问题，并尝试解决它。作为一名读者，我希望在您下一篇博客中能够看到更多关于RecyclerView滚动问题的解决方案。或许您可以深入探讨这个问题的根本原因，以及如何通过代码改进滚动的平滑性和精确性。我相信您的经验和见解将会给其他开发者带来启发和帮助。继续保持创作，并不断分享您的经验和技巧，因为您的博客对开发者社区来说非常宝贵。感谢您的努力和分享精神，期待您更多的精彩博文！
VMWare Ubuntu 20.04LTS中AOSP源码编译android 13一次成功的方法
CSDN-Ada助手: 恭喜您成功编译了VMWare Ubuntu 20.04LTS中AOSP源码的Android 13！这篇博客标题很吸引人，读了一下内容，发现您分享了一次成功的编译方法，非常有帮助。不过，我想提醒您，尽管您已经取得了很大的进展，但是AOSP源码编译仍然是一个复杂的过程，可能还有许多挑战等待着您。希望您能继续分享您的经验，并给出一些建议，例如处理一些潜在的错误或者优化编译过程等。感谢您的分享，期待您未来更多的创作！
使用Python的pymysql插入数据返回成功但数据库没有数据，ID却自增了
CSDN-Ada助手: 恭喜您写了第10篇博客！看到您在使用Python的pymysql插入数据时遇到的问题，尽管返回成功但数据库没有数据，ID却自增了，我想给予一些建议。首先，很高兴您能坚持不懈地创作，持续提升自己的技术能力。对于您的问题，我建议您先检查一下插入数据的代码逻辑，确保没有遗漏任何关键步骤。同时，您可以尝试打印出插入数据的SQL语句，以便进一步排查问题。另外，您也可以考虑查阅一些相关的文档或者向社区寻求帮助，或许会有人遇到过类似的问题并给出了解决方案。总之，感谢您的分享，期待您在下一篇博客中继续展示您的技术研究成果。请继续保持谦虚的态度，相信您一定能够找到解决问题的方法！
Javascript回调Android的方法，达到js和android交互的效果
CSDN-Ada助手: 恭喜作者写了第11篇博客！标题“Javascript回调Android的方法，达到js和android交互的效果”非常吸引人。你对于Javascript和Android交互的方法进行了深入的研究，这对于那些想要实现这种交互效果的开发者来说非常有帮助。在下一步的创作中，我建议你可以深入探讨一些实际的案例，例如在移动应用中使用Javascript回调Android方法的应用场景，或者给出一些实用的技巧和建议。此外，你也可以考虑分享一些你在这个过程中遇到的挑战和解决方案，这将对读者来说更具启发性。期待你继续创作，分享更多有关Javascript和Android交互的知识。谦虚的语气是非常重要的，因为技术领域的知识是不断发展和演进的，我们都有很多可以学习和改进的地方。祝愿你在接下来的创作中取得更大的成功！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。