![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
kaichu2
一只不断前行的小白~
展开
-
python3解析库lxml
主要参考这位博主的这篇博文,里面讲解的很详细!使我受益匪浅!表示感谢!python3解析库lxml大家可以参考原文,这里我只是选取了其中的两个表格,以供日后学习使用!1、Xpath常用规则2、XPath中的运算符...原创 2019-03-30 11:03:31 · 403 阅读 · 0 评论 -
爬虫抓取网页图片
抓取网页的全部图片!然后再逐一保存!import requestsfrom lxml import etree#面向对象编程class Spider(object): def __init__(self): #反爬虫措施,加请求头部信息,这个是在network中查看的 self.headers={ 'User-Agent': 'Mozilla/5.0 (Window...原创 2019-04-01 21:58:41 · 720 阅读 · 0 评论 -
爬虫——小练习
本篇爬虫主要就是爬取某个网页的数据,并将爬取的数据保存下来!我这里用的是pycharm软件,python版本是3.7.2,其他的版本没有测试过!下面直接放代码,内部有部分代码的注释!然后再对每个部分进行分析!# _*_ coding:utf-8 _*_""" 作者:king of kasa 内容:爬虫-小练习 加油!keep running! ema...原创 2019-03-28 22:02:30 · 3158 阅读 · 0 评论