不点蓝字,我们哪来故事?
本篇文章讲述python爬虫如何爬取静态网页内容。![c11687c3916b58734210d9d53119e5cc.gif](https://i-blog.csdnimg.cn/blog_migrate/f4b78e01f6f3e7738e59cfb2e195e7ac.gif)
![f47371a3d56063a978c81acc949a37e2.gif](https://i-blog.csdnimg.cn/blog_migrate/0f8a97cbe279f5e1a4a6e300ba58801e.gif)
![547e9301fe0b19987c8b20d848fd4727.gif](https://i-blog.csdnimg.cn/blog_migrate/b754e38d4ba2acdfb844655eb2c09d31.gif)
通过requests库获取网页内容
通过其他库解析网页来提取所需要的内容
保存
我们以笔趣阁小说章节url为例
首先分步实现
获取网页内容
import requestsurl = 'http://www.biquge.info/10_10582/'source_page = requests.get(url).content.decode('utf-8')#使用requests中的get方法获取网页内容
解析网页,本篇通过xpath来解析