Scrapy实例__链家租房爬虫

最新推荐文章于 2024-03-13 09:53:04 发布

shu@

最新推荐文章于 2024-03-13 09:53:04 发布

阅读量373

点赞数

文章标签： python

本文链接：https://blog.csdn.net/chengshudecao/article/details/106152908

版权

Scrapy实例__链家租房爬虫

创建爬虫项目

scrapy startproject lianjia_zf

定义爬取的数据项

import scrapy


class LianjiaZfItem(scrapy.Item):
    title = scrapy.Field()  # 标题
    update_time = scrapy.Field()  # 房源更新时间
    price = scrapy.Field()  # 月租
    tags = scrapy.Field()  # 标签
    rent_method = scrapy.Field()  # 出租方式
    house_type = scrapy.Field()  # 房屋类型
    towards_and_floor = scrapy.Field()  # 朝向楼层
    basic_info = scrapy.Field()  # 房屋信息
    supporting_facilities = scrapy.Field()  # 配套设施
    description = scrapy.Field()  # 房源描述
    url = scrapy.Field()  # 详情页链接

编码spider爬取数据

# -*- coding: utf-8 -*-
import scrapy
from items import LianjiaZfItem


class LianjiaSpider(scrapy.Spider):
    name = 'lianjia'
    allowed_domains = ['lianjia.com']
    start_urls = ['https://sz.lianjia.com/zufang/']

    def parse(self, response):
        house_items = response.xpath('//*[@id="content"]/div[1]/div[1]/child::div')
        for house_item in house_items:
            href_xpath = './a/@href'
            house_url = house_item.xpath(href_xpath

最低0.47元/天解锁文章

shu@

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
Scrapy实例__链家租房爬虫

Scrapy实例__链家租房爬虫创建爬虫项目scrapy startproject lianjia_zf定义爬取的数据项import scrapyclass LianjiaZfItem(scrapy.Item): title = scrapy.Field() # 标题 update_time = scrapy.Field() # 房源更新时间 price = scrapy.Field() # 月租 tags = scrapy.Field() # 标.
复制链接

扫一扫