自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

rossisy的博客

11月 10月 09月 07月 06月 04月 03月 02月

原创 Scrapy - 普通的Spider（二）

XMLFeedSpider 这个Spider是用于解析XML的，它可以通过指定的节点迭代的解析XML。迭代器可以选择iternodes，xml或html。由于xml和html都需要一次性读取整个DOM然后才能解析XML，这样会有性能的问题，所以推荐使用iternodes迭代器。但是当解析有错误标记的XML时，使用html迭代器会有些帮助。使用XMLFeedSpider必须定义以下类属性来设置迭代器

2017-11-02 22:21:11 363

原创 Scrapy - 普通的Spider（一）

CrawlSpider 这个是Spider中爬取一般网站最常用的一种Spider，因为它提供了一种方便的机制可以自定义一套规则去追踪链接。它可能对特殊的网站或项目来说不是最适合的Spider，但是对一般情况来说已经足够了，因此我们可从这种Spider开始学习，然后修改它，或重新写一个自定义的Spider。除了从父类集成来的属性，这个Spider还有特有的属性和方法： rules - 一个Rul

2017-11-02 21:24:18 447

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

rossisy CSDN认证博客专家 CSDN认证企业博客

码龄15年

IP 属地：广东省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

31: 原创

26万+: 周排名

82万+: 总排名

13万+: 访问

: 等级

1198: 积分

8: 粉丝

23: 获赞

9: 评论

58: 收藏

私信

关注

热门文章

分类专栏

GIT 4篇
Vim+Vundle 2篇
Vundle
CentOS 7篇
Jenkins 2篇
robotframework 1篇
MAC 2篇
MySQL 8篇
Linux 4篇
JAVA 1篇
Maven 1篇
Nginx 1篇
Liunx 1篇
Python 7篇
ITerm2 1篇
Vim 1篇
Scrapy 4篇

最新评论

CentOS7设置固定IP
henu-zwh: 你笑死我了哈哈哈
CentOS7设置固定IP
CrAcKeR-1:
CentOS7设置固定IP
vibber: 安装下 yum install net-tools 就可以使用ifconfig
CentOS7设置固定IP
喧嚣尘上醉月楼: 我都用ifconfig看了好几年了，突然看到你这个评论，以为自己一直看的是假IP
CentOS7下使用Yum安装MySQL
昵称已经被占用咯: 写的不错哦,欢迎回访我的博客哦

最新文章

提示

确定要删除当前文章？

取消删除