废话不多说,上代码。
总体思路是构建函数然后循环。
函数分两块,第一个函数得到标题和每一章节的网址,第二个函数得到每一章节的具体内容,然后循环就ok。
import urllib.request as req
import re
#打开页面,找到正文
url = 'https://www.gulongwang.com/liu/'
name = '流星蝴蝶剑'
def get_url_title(url):
the_url = 'https://www.gulongwang.com/'
webpage &