微博粉丝个人信息爬取

首先分析微博网页端的两个页面,发现weibo.com只能获取博主前五页的粉丝列表,weibo.cn能获取前20也粉丝列表。于是分析手机端,本人用手机试着划了下博主粉丝页,发现也只能获取两千左右的粉丝数,目前没有找到更好的方法获取全部粉丝。

用Charles抓取手机端博主粉丝页请求,发现一个接口可以返回粉丝json数据,url中since_id用来翻页,通过拼接url实现翻页请求,jsonpath抓取粉丝id。

利用weibo.cn这个简洁版页面获取粉丝信息

 

通过拼接url:www.weibo.cn/"粉丝ID"/info获取粉丝详细信息

 

xpath抓取详细信息 

 

大概目前想到就这么多 第一篇项目博客写的很乱 有需要可以留言交流

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值