python闲鱼爬虫_python爬虫深层次,全程的编码和使用

爬虫整个过程中,需要蜘蛛,调度器,下载器,管道 的配合,才能真正完成整个操作,今天就来说一说这个过程以及编码和使用过程:

本章主要了解一下item和pipline的运用

(注意:在使用item的前提是,将setting文件中的ITEM_PIPELINES释放)

ITEM_PIPELINES ={'kgc.pipelines.KgcPipeline': 300,

}

代码预览:

spider.py

importscrapyfrom kgc.items import *

classKgcspideSpider(scrapy.Spider):

name= 'kgcspide'

start_urls = ['http://www.kgc.cn/list/230-1-6-9-9-0.shtml']defparse(self, response):

title = response.css('a.yui3-u.course-title-a.ellipsis::text').extract()

price=response.css('div.right.align-right>span::text').extract()

persons=response.css('span.course-pepo::text').extract()

datas=zip(title,price,persons)for d indatas:

item=KgcItem()

item['title']=d[0]

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值