按f12,查看页面元素
就会发现它所有的标题,和网址,我们要获取小说内容的,那就需要获取其网页链接,然后发送请求,获取网页内容,然后就是解析网页,筛选其中的内容
最终效果
用到的库
pip install requests
pip install bs4
完整代码
import os
import time
import requests
from bs4 import BeautifulSoup
def books(path,url1):
# 创建文件夹
path = path
# path是文件夹或者文件的相对路径或者绝对路径
if os.path.exists(path):
pass
else:
os.mkdir(path)
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Geck