在前面的理论知识后,大致对爬虫以及快速获取初步爬虫代码有一些理解了
今天以掘金网
为例,爬取首页文章标题、作者以及url等信息
没有安装Python环境的请先自行去找教程安装
获取爬虫初步请求
还不知道怎么操作的,可以去看看Day02的内容
快速获取请求
安装完必备第三方库,请求就完事了
pip install requests
pip install json
示例如下:
import requests
import json
headers = {
"authority": "api.juejin.cn",