Scrapy学习过程之五：item

最新推荐文章于 2023-12-13 10:37:13 发布

五星上炕

最新推荐文章于 2023-12-13 10:37:13 发布

阅读量271

点赞数

分类专栏： Scrapy 文章标签： Scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dkfajsldfsdfsd/article/details/97268358

版权

Scrapy 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

参考：https://docs.scrapy.org/en/latest/topics/items.html#scrapy.item.Item

Scrapy architecture

SPIDER将从网页中提取出来的数据以dict的形式发射出去，这个dict直接写在代码中，很容易写错，也不能复用。

因此Scrapy专门提供了一个类item class，用来专门定义dict的结构，比如包含那些字段名等。这样集中管理不容易出错，出错也容易修改，可以复——提供了很多有用的存取器。

Declaring Items

import scrapy

class Product(scrapy.Item):
    name = scrapy.Field()
    price = scrapy.Field()
    stock = scrapy.Field()
    tags = scrapy.Field()
    last_updated = scrapy.Field(serializer=str)

就是定义了一个专门用于存取数据的类，然后调用相关的方法就可以存取数据了，有点像JAVA BEAN。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scrapy学习过程之五：item

参考：https://docs.scrapy.org/en/latest/topics/items.html#scrapy.item.ItemSPIDER将从网页中提取出来的数据以dict的形式发射出去，这个dict直接写在代码中，很容易写错，也不能复用。因此Scrapy专门提供了一个类item class，用来专门定义dict的结构，比如包含那些字段名等。这样集中管理不容易出错，出错...
复制链接

扫一扫

专栏目录

博客等级

码龄12年

137
原创

211
点赞

729
收藏

137
粉丝

关注

私信

热门文章

分类专栏

微信小程序
VirtualBox 5篇
Linux网络虚拟化 10篇
Docker 24篇
kubernetes 38篇
Hadoop 5篇
微服务
安全 5篇
Maven
CSS
Java语言 28篇
Java WEB开发 2篇
Hibernate 2篇
Email 1篇
Dubbo 11篇
Spring
Scrapy 9篇

最新评论

Dubbo上下文信息、隐匿参数附件（六）
菜鸡copy&parse: 请问我在调用端通过setAttachment 增加了附加属性，但是在服务端过滤器中死活取不到属性值是什么情况？
VirtualBox网络之仅主机(Host-Only)网络
menglihuimou: 博主你好，我请教一下我这里用了这个新建的网络都上不了网了，更别说别的了。怎么解决？能否指点一二，非常感谢。我做到添加路由这步了。
OAuth 2.0 Framework Client Registration（2）
小马哥能有什么坏心思: 非常感谢，前几段内容就解决了我对 Client Registration 的疑惑。
VirtualBox网络之仅主机(Host-Only)网络
fuochai: 怪事虚拟机的Firefox浏览器可以上网但终端就不行加了路由和dns也不行之前还可以的除了故障恢复了备份现在就怎么都搞不出了
VirtualBox网络之仅主机(Host-Only)网络
fuochai: 请问网络与共享中心里虚拟网卡设置默认网关总是自己消失怎么回事？导致linux没有网关

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。