【Scrapy】Item

Item用于存储从页面中提取出的结构化数据,相当于实体类

官方文档:https://docs.scrapy.org/en/latest/topics/items.html

Scrapy支持多种Item对象,包括Python字典、scrapy.Item类以及其他几种键值对对象

自定义Item:

class MyItem(scrapy.Item):
    foo = scrapy.Field()
    bar = scrapy.Field()

使用Field类定义Item支持的字段(Field实际上仅仅是dict的别名),可以给Field指定任何类型的“元数据”,例如:

foo = scrapy.Field(type=str, length=32)

通过Item.fields属性获取所有声明的字段

>>> MyItem.fields
{'bar': {}, 'foo': {'type': <class 'str'>, 'length': 32}}

Item的使用方式与dict类似,可通过关键字参数创建,通过下标访问和给字段赋值

>>> item = MyItem(foo='abc', bar=123)
>>> item['foo']
'abc'
>>> item.fields['foo']
{'type': <class 'str'>, 'length': 32}
>>> item['baz'] = 1
Traceback (most recent call last):
  File "<input>", line 1, in <module>
  ...
KeyError: 'MyItem does not support field: baz'

Scrapy 2.2提供了itemadapter.ItemAdapter类和itemadapter.is_item()函数用于为处理不同类型的Item对象提供统一的接口

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值