笔趣阁小说下载python-CSDN博客

本文链接：https://blog.csdn.net/qq_51050526/article/details/117749439

运行时复制如图所示即可

import requests
import  time
from lxml import etree
from bs4 import BeautifulSoup
import re
def get_html(url):
    headers={'user-agent':' Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.77 Safari/537.36 Edg/91.0.864.41'}
    return requests.get(url,headers).text
def judge(url):
    c=re.findall('https://www.uubiqu.com/read/[0-9]+/',url)
    return c[0]
url=input("输入你要下载小说的链接:")
target_url=judge(url)
soup=get_html(url)
# print(soup)
e=BeautifulSoup(soup,'lxml')
dl_list=e.find('div',id='list').dl
dd_list=dl_list.find_all("dd")
# print(dd_list)
fp=open("./测试.txt",'w',encoding="utf-8")
for dd in dd_list[9:]:
    content_url='https://www.uubiqu.com'+dd.a['href']
    # print(content_url)
    content_text=get_html(content_url)
    # print(content_text)
    content_soup=BeautifulSoup(content_text,'lxml')
    content=content_soup.select('.content>p')
    fp.write(dd.a.string + "\n")
    for i in content:
            # print("%s"%i.get_text())
            fp.write(i.get_text())
    fp.write("\n")
    print(dd.a.string+"完成")
    time.sleep(0.1)

写于2021-6-09
新手，如有问题希望批评