从链家网上爬取租房数据并进行数据分析

最新推荐文章于 2024-04-23 14:37:36 发布

Yoooung～

最新推荐文章于 2024-04-23 14:37:36 发布

阅读量1.3k

点赞数 1

分类专栏： python

本文链接：https://blog.csdn.net/m0_54797890/article/details/113996776

版权

数据爬取(scrapy)# 创建工程scrapy startproject lianjiacd lianjiascrapy genspider gethouse www.xxx.comitems.pyimport scrapyclass LianjiaItem(scrapy.Item): # define the fields for your item here like: # name = scrapy.Field() name = scrapy.Field(

摘要由CSDN通过智能技术生成

数据爬取(scrapy)

# 创建工程
scrapy startproject lianjia
cd lianjia
scrapy genspider gethouse www.xxx.com

items.py

import scrapy


class LianjiaItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    name = scrapy.Field()
    community = scrapy.Field()
    area = scrapy.Field()
    house_type = scrapy.Field()
    acreage = scrapy.Field()
    price = scrapy.Field()

gethouse.py

import scrapy
from ..items import LianjiaItem
import re
page = 100
areas = ['dongcheng', 'xicheng', 'haidian', 'chaoyang']


class GethouseSpider(scrapy.Spider):
    name = 'gethouse'
    # allowed_domains = ['www.xxx.com']
    start_urls = []
    for area in areas:
        for i in range(1, page+1):
            start_urls.append('https://bj.lianjia.com/zufang/{}/pg{}/'.format(area, i))

    def parse(self, response)

最低0.47元/天解锁文章

Yoooung～

关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
从链家网上爬取租房数据并进行数据分析

数据爬取(scrapy)# 创建工程scrapy startproject lianjiacd lianjiascrapy genspider gethouse www.xxx.comitems.pyimport scrapyclass LianjiaItem(scrapy.Item): # define the fields for your item here like: # name = scrapy.Field() name = scrapy.Field(
复制链接

扫一扫

专栏目录