图片来源网络
写在前面
最近在学习python,总想着自己动手弄一个简单一点的程序。于是想到了使用python和selenium爬小说
说起小说,想起了自己的一段“过往”。
我以前不太喜欢看书,但是从高中的时候开始接触了言情小说,并且一发不可收拾,很是沉迷。可能是青春期吧...... (〃'▽'〃)
那时候看言情小说都是同学之间相互借阅着看的,小说、杂志。杂志像是《花火》一类的。高中时代,也没有什么钱天天买这些,都是些零花钱省下来买的
到了大学,有了手机以后都是从网上下载到手机上看的。算了一下,大学的时候看的小说比较多,感觉有100多本....还不止。因为我有一个专门放小说的U盘,保存着我觉得好看的小说,里面的言情小说就有70多本
当时觉得好看的小说,现在都被拍成了电视剧。比如《步步惊心》、《何以笙箫默》、《三生三世十里桃花》等等,感觉挺好的
目标网站
这次要爬的网站是晋江文学城的小说,晋江文学城有免费的小说,可以在线看。但是如果要下载下来是需要晋江币的
现在的目标就是,下载已经完结的免费小说。这是免费小说的地址
网站截图
爬小说思路
总的思路为:
1、打开免费小说页面
2、新建文件夹,用于保存爬取的小说,路径为D:\novel
3、获取所有免费已完结小说的名字、小说链接地址,结果保存到数组
4、打