web scraper 爬取微博粉丝性别以及微博内容

最新推荐文章于 2023-10-13 23:25:05 发布

szdx1043

最新推荐文章于 2023-10-13 23:25:05 发布

阅读量2.6k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/szdx1043/article/details/88077808

版权

一.粉丝性别

两个地方要注意：

1. 翻页，由于查看粉丝数限制，如果一直点下一页，会卡在第5页或者第10页，最后数据无法保存。所以还是在url里写上页数范围，这样最后数据可以保存：比如第一页网址：是 weibo.com/p/1005056932774899/follow?relate=fans&page=1#Pl_Official_HisRelation__59，那直接改为page=[1-5]，就可以访问前五页了。

2.过滤性别。性别图标不是text也不是image，我想的办法是提取那一整行html，然后regex f*e*male，这样就能提取male或者female，如下图：

二.微博内容：

1.翻页继续选择上述方法

2.展开全文的爬取：

先element scroll 滚到底：

然后直接提

最低0.47元/天解锁文章

关注

2
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
web scraper 爬取微博粉丝性别以及微博内容

一.粉丝性别两个地方要注意：1. 翻页，由于查看粉丝数限制，如果一直点下一页，会卡在第5页或者第10页，最后数据无法保存。所以还是在url里写上页数范围，这样最后数据可以保存：比如第一页网址：是 weibo.com/p/1005056932774899/follow?relate=fans&amp;page=1#Pl_Official_HisRelation__59，那直接改为page...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。