**
这次需求是抓取知乎的文章
**
1.我们打开知乎,搜索来到你要抓的用户页面(就像我下面截图所示)
2.来到文章界面,作为习惯,拿到一个网站我会按下F12查看网络请求,哦,看到动态加载出来的接口。
翻找一下,看到我们需要的数据都列在了接口中。嘴角上扬,这种网站抓起来就是两个字:舒服。
3.我们往下来,康康刷新出来新加载出来的接口有什么区别
发现换的就只有offset嘛,每页就往上加了20,看到这这就基本完事了
import time
import pymysql
import requests
import re
class ZhiHu:
def __init__(self):
self.db = pymysql.connect(host='127.0.0.1', port=3