目录
概述
简单的用python的一些库爬取豆瓣读书top250的书籍。
一、导入相关库
import requests
import re
import time
二、代码编写
2.1获取当前页面的数据
''' 获取一页的数据 '''
def get_one_page(url):
#添加User-Agent
headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/120.0.0.0 Safari/537.36 Edg/120.0.0.0'
}
#发送请求,并且将请求头加上
response = requests.get(url,headers=headers)
#获取当前页面的编码方式并设置
response.encoding = response.apparent_encoding
#获取页面内容