python使用正则表达式库re实现爬取名人名言

如痴如醉�

于 2020-05-18 23:15:38 发布

阅读量686

点赞数

分类专栏： python 文章标签： python 正则表达式 json

本文链接：https://blog.csdn.net/Verilogerr/article/details/106203709

版权

python实现爬取名人名言

技术路线：requests-re
使用time库对爬取时间进行计时
使用input进行输入爬取的页码范围
使用yield生成器，更好的节省内存空间，响应速度更快
在这里插入图片描述
使用yield一般与循环搭配到一起
采用json文本进行写入，此时的文件写入方式记得设置为追加写a，如果是覆盖w，那么就会每一次生成一个字典就会覆盖之前写的。
代码如下：

import requests
import re
import json
import time

def gethtml(url, kv):
    r = requests.get(url, params=kv)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    return r

最低0.47元/天解锁文章