4ye含泪用python爬取了自己的公众号粉丝数据

4ye含泪用python爬取了自己的公众号粉丝数据

小伙伴们好呀,最近本来是在捣鼓Gateway的知识点的,结果被一件事情搞得心不在焉 哈哈哈哈,结果不得不先鸽下~ 搞完这件事情再继续哦!! ε=ε=ε=( ̄▽ ̄)

本来这篇文章得昨天发的,可是出了大大的意外~ (表情👉:) ( o=^•ェ•)o ┏━┓

我以后尽量多准备些备用文章 哈哈哈哈,免得经常断档~ (~o ̄3 ̄)~

img

起因

我先简单称述下事情滴经过~

由于最近过年过节发滴红包频繁些~ 导致有好多好友来加我,本想搞个粉丝群活跃下气氛,结果发现来滴怕不是机器人咯,这抢红包滴速度飞快呀,而且 4ye 做事太草率了 没有先验证对方是不是真的粉丝 想进群的都给拉进去了 事后才觉得哪里不对劲!过分! ( ﹁ ﹁ ) ~→

img

坑🕳

想着既然已经进群了,那我就自己一个个排查下好了(虽然也就那么12345678个人 … ) (ˉ▽ˉ;)…

那一刻我还傻傻地以为微信可以轻松地导出群成员~

尝试到最后发现web端早不能用了 😵

但是 4ye我头铁,不肯放弃,愣是想从技术角度上去摸索下,结果搞了老半天都没有搞定 我晕

ps:不过现在我有新的想法想尝试下了 嘿嘿 卖个关子先~

正题

简单介绍下公众号的特征~

公众号有个人的,有政府组织的,还有企业的~

4ye的公众号是个人的~ 😝

这也是为啥有小伙伴在公众号后台留言我看到直接回复他 哈哈哈哈

当然小伙伴还是加我微信才能好好沟通~

image-20210220082609054

没有接口权限

个人的公众号是没有办法通过微信认证的,所以下面很多接口都没有权限的(不然我也不用自己去爬了 😵)

image-20210220083636474

结果数据

最后的效果如图~

将拿到的 用户名称和头像 存取到文本中,

为啥存起来呢~ 当然是当个小数据,为了后面找出群里的假粉做准备~😝

后面有空也可以做下词云看看 😁(给你们一些小惊喜~ 😋)

image-20210220081446738

爬取思路

当然得先在后台分析研究下用户列表,将想要的页面数据和获取下一页发出的 API 进行分析 ,有兴致的小伙伴们可以先自己研究下哦 ~

这里就简单说下用到的包 (注意这里使用到 HTTP2.0 了哦~)

import requests
from bs4 import BeautifulSoup
from hyper.contrib import HTTP20Adapter

还有回来的数据中文乱码的话 记得设置 res.encoding = 'UTF-8'

window下写文件时可能也要设置 utf8 哦 fo = open("fans.txt", "a+", encoding='utf-8')

最后

我也收拾收拾准备回广州啦~ seeyou😝

img

作者简介 :Java4ye 一个专注于提高工作效率~ (增加摸鱼时间) 的小白博主,分享学习资源,技术感悟,程序员生活的点点滴滴 让我们一起摸鱼~(●ˇ∀ˇ●)

关注公众号: Java4ye 这里给你准备了一系列学习资源啦,还有各种插件,软件哦
欢迎留言!谢谢支持!ヾ(≧▽≦*)o

2021一起好好加油! (ง •_•)ง
wechat

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值