python爬去新浪微博_Python 爬虫如何机器登录新浪微博并抓取内容?

啊喂,你们不要只收藏不点赞啊 = =

稍微更新一下,多说两句。

虽然爬取移动端比较简单,但是爬一点难的东西对身体好对吧。

总结一下这个模拟登陆涉及的东西:

1.用户名经过base64加密。

2.输入用户名后会进行预登陆操作。

3.密码明文与一些其它的字符串参数拼接后,使用RSA加密,再提交给服务器,其中RSA公钥和各种参数都可以从预登陆操作返回的结果中找到。

4.会出现两个跳转。

所以思路如下:

1.用base64加密用户名之后仿造一个预登陆,用正则匹配得到各项参数。

2.用上一步里得到的参数,拼接密码明文,再用RSA加密得到密文,并构造POST的form data。

3.使用构造好的form data仿造登录请求

4.用正则匹配获得跳转的目标链接。

5.为了保持登陆,用cookiejar一类的工具绑定一个cookie就行了。

======以下原答案=======

刚写完这个爬虫。。

新浪这东西做的煞是恶心。

代码和分析过程写在我blog里了。

http://shrik3.com/2016/03/25/sina-login/

[更新:我的博客改版了,以前的旧文章全部删除,如果您是在有兴趣,可以私信我一个邮箱,我把备份发送给您]

测试可以用。

有理解不对的地方欢迎聚聚们指正

。。

你说的最后那段代码,是从重定向页面中获取新的url然后继续登陆,然而少了一步喔。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值