hello,大家好,我是wangzirui32,今天我们来学习如何爬取CSDN博客各专栏访问量,开始学习吧!
1. HTML分析
这里以我的博客主页为例,打开https://blog.csdn.net/wangzirui32,再打开开发者工具,找到装着专栏信息的div标签:
再点击其中的一个专栏,进行解析:
2. 编写代码
代码奉上——(不懂看注释)
from requests import get
from bs4 import BeautifulSoup as bs
from fake_useragent import UserAgent as UA
import time
"""
安装fake_useragent命令:pip install fake_useragent
"""
# 生成请求头
headers =