现在已经能够爬取单章内容,如果要爬取整部小说,利用现在的代码就是:手动输入每一章的网址,然后运行代码……考虑到网络 小说动辄几百上千甚至上万的章节数,手动下载是一个十分艰苦漫长的任务!!
如果 能得到小说所有章节的链接,通过遍历所有链接就能下载整部小说了。、
从哪里找所有章节的链接?
打开卡徒的目录页(https://www.52bqg.com/book_12525/)
在目录页点右键“查看网页源代码”,从源代码页中可以看到,小说所有章节的名称和链接都在这里。
现在要做的就是从目录页中提取出所有章节的名称和链接!
查看源代码,发现所有的章节名称和链接都在标签<div,id='list'>下的<a></a>里