目录
1 项目分析
我们可以在首页中找到所有的章节
每一个章节是一个a标签,a标签连接到该章节的内容
但这个网站他有bug,章节都是乱套的,我们无视这种错误,直接保存
2 代码
思路就是先把网页爬下来,然后从网页找找到章节名称与章节链接,之后再请求对应的章节链接,把章节内容爬下来
爬了几个之后我就手动停掉了
在result中会出现这些txt
并且内容也与网站上看到的一样
目录
我们可以在首页中找到所有的章节
每一个章节是一个a标签,a标签连接到该章节的内容
但这个网站他有bug,章节都是乱套的,我们无视这种错误,直接保存
思路就是先把网页爬下来,然后从网页找找到章节名称与章节链接,之后再请求对应的章节链接,把章节内容爬下来
爬了几个之后我就手动停掉了
在result中会出现这些txt
并且内容也与网站上看到的一样