今天你想爬谁的粉呢?
谁粉多,就爬谁。
那谁有粉?
沉默王二有粉。
今天咱们继续学习 Python 爬虫,从本篇博客开始进行短暂的(15 篇)多线程爬虫学习。
第一篇就要采集 大佬@沉默王二
的粉丝,坐拥 27W+ 读者,属实让人羡慕。
目标数据源分析
本次要抓取的数据源是 https://blog.csdn.net/qing_gee?type=sub&subType=fans
,其中的 ID 可以切换为你希望采集的 ID,当然包括你自己的 ID。
该页面下滑刷新会自动请求一个 API 接口,即 https://blog.csdn.net/community/home-api/v1/get-fans-list?page=3&size=20&noMore=false&blogUsername=qing_gee
,其中参数如下:
page
:页码,根据目标人粉丝总数 / 20 计算获取即可;size
:每页数据,默认值 20;noMore</