本教程可以一键获取连载小说最新章节,只需要运行一下代码,直接打开浏览器看小说未看的最新章节
#开发环境
- Python版本: python3.6
- Python第三方库:requests、lxml、webbrowser
- Pycharm软件版本:pycharm 2017.1.3
- 电脑系统:Windows 10 64位系统
- 浏览器: Chrome 59.0.3071.86
本文的源码在github上:https://github.com/lanhaixuan/Novel-latestchapter
本项目的目的:一键获取纵横中文网未看的连载小说章节
#开始实战
创建一个爬虫项目
#分析网站
- 分析网页界面
- 分析网页结构
- 分析网页原代码
1.分析网页界面
在纵横中文网首页,我们需要通过搜索栏查看想看的小说
##2.分析网页结构
但我们点击浏览时,我们会发现网页网址有规律,这是我们找到的规律:
- 搜索的内容是红色显示的
- 当我们收入正确的小说名时,第一条就是我们想要的数据
- all/ 后面是我们输入的值
- 当我们点击搜索结果第一条 阅读免费章节 时,网页会跳转到章节目录
##3.分析网页原代码
- 分析搜索界面的代码
- 分析章节界面的代码
我们发现,搜索小说的url格式:
http://search.zongheng.com/search/all/小说/1.html
只需要把小说改成我们要看的小说名就可以
###1.分析搜索结果界面的代码