学习scrapy使用

DN_XIAOXIAO

于 2021-10-14 22:58:13 发布

阅读量118

点赞数

分类专栏： scrapy 文章标签： python

本文链接：https://blog.csdn.net/DN_XIAOXIAO/article/details/120774273

版权

scrapy 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

运行scrapy 中的spider

新建run.py

from scrapy import cmdline
cmdline.execute("scrapy crawl tq".split(" "))

判断获取元素的类型

print(type(sevenday(对象)))

获取对象中所有数据对象.getall(); 对象.get()中的第一元素

组装数组：

在items中组装字段

import scrapy
from ..items import TqybItem
class TqSpider(scrapy.Spider):
    name = 'tq'
    allowed_domains = ['weather.com.cn']
    start_urls = ['http://www.weather.com.cn/weather/101010100.shtml']

    def parse(self, response):
        #print(response.text)
        sevendays = response.xpath('//div[@class="con today clearfix"]//div[@id="7d"]//h1/text()').getall()
        #print(type(sevendays))
        for sevenday in sevendays:
            day = sevenday
            print(type(sevenday))
            item = TqybItem(day=day)
            yield item #发给pipelines

yield item 发给管道

DN_XIAOXIAO

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
学习scrapy使用

运行scrapy 中的spider新建run.pyfrom scrapy import cmdlinecmdline.execute("scrapy crawl tq".split(" "))判断获取元素的类型print(type(sevenday(对象)))获取对象中所有数据对象.getall(); 对象.get()中的第一元素组装数组：在items中组装字段import scrapyfrom ..items import TqybItemclass TqS.
复制链接

扫一扫

专栏目录