python爬去新浪微博_Python 爬虫如何机器登录新浪微博并抓取内容？

最新推荐文章于 2021-03-22 09:10:45 发布

weixin_39998998

最新推荐文章于 2021-03-22 09:10:45 发布

阅读量185

点赞数

文章标签： python爬去新浪微博

啊喂，你们不要只收藏不点赞啊 = =

稍微更新一下，多说两句。

虽然爬取移动端比较简单，但是爬一点难的东西对身体好对吧。

总结一下这个模拟登陆涉及的东西：

1.用户名经过base64加密。

2.输入用户名后会进行预登陆操作。

3.密码明文与一些其它的字符串参数拼接后，使用RSA加密，再提交给服务器，其中RSA公钥和各种参数都可以从预登陆操作返回的结果中找到。

4.会出现两个跳转。

所以思路如下：

1.用base64加密用户名之后仿造一个预登陆，用正则匹配得到各项参数。

2.用上一步里得到的参数，拼接密码明文，再用RSA加密得到密文，并构造POST的form data。

3.使用构造好的form data仿造登录请求

4.用正则匹配获得跳转的目标链接。

5.为了保持登陆，用cookiejar一类的工具绑定一个cookie就行了。

＝＝＝＝＝＝以下原答案＝＝＝＝＝＝＝

刚写完这个爬虫。。

新浪这东西做的煞是恶心。

代码和分析过程写在我blog里了。

http://shrik3.com/2016/03/25/sina-login/

[更新：我的博客改版了，以前的旧文章全部删除，如果您是在有兴趣，可以私信我一个邮箱，我把备份发送给您]

测试可以用。

有理解不对的地方欢迎聚聚们指正

。。

你说的最后那段代码，是从重定向页面中获取新的url然后继续登陆，然而少了一步喔。

weixin_39998998

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬去新浪微博_Python 爬虫如何机器登录新浪微博并抓取内容？

啊喂，你们不要只收藏不点赞啊 = =稍微更新一下，多说两句。虽然爬取移动端比较简单，但是爬一点难的东西对身体好对吧。总结一下这个模拟登陆涉及的东西：1.用户名经过base64加密。2.输入用户名后会进行预登陆操作。3.密码明文与一些其它的字符串参数拼接后，使用RSA加密，再提交给服务器，其中RSA公钥和各种参数都可以从预登陆操作返回的结果中找到。4.会出现两个跳转。所以思路如下：1.用base...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。