pc端客户端爬虫_爬虫微博模拟登陆-从移动端到PC端

最新推荐文章于 2023-09-12 16:04:50 发布

人间最好小师叔

最新推荐文章于 2023-09-12 16:04:50 发布

阅读量425

点赞数 1

文章标签： pc端客户端爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_31442209/article/details/112042600

版权

本文介绍了如何使用Python的requests库，通过移动端方式模拟登录微博，并利用登录后的cookie访问PC端页面，规避复杂校验。作者提供了一段代码示例，展示如何构造POST数据并获取登录状态，最终实现对微博PC端的爬取。

摘要由CSDN通过智能技术生成

爬虫登陆微博，相信是诸多爬虫爱好者必须跨过得一道坎。这不，这几天我也在研究如何能够快速而简洁得实现登陆功能。

当然，前期工作一定要做好，我先google + 百度了一把市面上的微博登陆教程，发现基本上都是PC端的base64加密用户名，然后RSA加密拼接关键信息，最后组合成POST的from data 进行登陆。

摆在我面前的有两条路，一条走PC端，一条走移动端。鉴于PC端已经有详尽教程，此时，我决定走一走移动端的路子。基于以往经验，任何网站如果有移动端，那一定是非常容易进行爬取的。果不其然，移动端的微博登陆比我想象得还要简单，一个简单的POST即可搞定。

与此同时，在抓包的过程中，我亦发现，微博在移动端登陆以后，会先访问3个cross domain的网址来设置cookie。此刻，请大家注意，经过这三个cross domain的设置后，我们居然可以直接以登陆状态访问PC端。即在技术上以移动端作为翘板，完美避开PC端复杂的校验和加密。

曲线救国，古之人诚不我欺也!

Talk is cheap. Show me the code。

#-*- coding=utf-8

from requests import Session

import json

def formatUrl(urldict):

for key,value in urldict.items():

urldict[key]=value.replace("\\",'')

headers={'User-Agent':

最低0.47元/天解锁文章

人间最好小师叔

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
pc端客户端爬虫_爬虫微博模拟登陆-从移动端到PC端

爬虫登陆微博，相信是诸多爬虫爱好者必须跨过得一道坎。这不，这几天我也在研究如何能够快速而简洁得实现登陆功能。当然，前期工作一定要做好，我先google + 百度了一把市面上的微博登陆教程，发现基本上都是PC端的base64加密用户名，然后RSA加密拼接关键信息，最后组合成POST的from data 进行登陆。摆在我面前的有两条路，一条走PC端，一条走移动端。鉴于PC端已经有详尽教程，此时，我决定...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。