【项目】房天下数据爬取

最新推荐文章于 2023-09-02 23:28:27 发布

XHDANE

最新推荐文章于 2023-09-02 23:28:27 发布

阅读量526

点赞数

分类专栏： python 有趣项目

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/XHDANE/article/details/84334467

版权

python 有趣项目专栏收录该内容

6 篇文章 0 订阅

订阅专栏

需求：

1，获取所有的城市URL

2,获取所有城市》新房URL

3,获取所有城市》二手房URL

代码逻辑：

》》基本创建,start.py启动文件

from scrapy import cmdline

cmdline.execute("scrapy crawl sfw".split())

》》middlewares.py -->随机请求头中间件

》》spiders-->fang6.py

#允许爬取的域名范围

allowed_domains = ['fang.com']

（1）def A(self,response)：

获取所有地区名、链接

（2）def B(self,response)：

获取地区--新房--名字、价格等所有数据

（3）def C(self,response)：

获取地区--2手房--名字、价格等所有数据

》》items-->fang6.py连接，

》》items：写要爬取范围名称

fang6：导入items.py，调用

from fang.items import （class）

   item = NewHouseItem(name=name,rooms=rooms)

》》pipelines-->数据存储

def __init__(self):

def process_item(self, item, spider):

def close_spider(self):

》》

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
【项目】房天下数据爬取

需求：1，获取所有的城市URL2,获取所有城市》新房URL3,获取所有城市》二手房URL代码逻辑：》》基本创建,start.py启动文件from scrapy import cmdlinecmdline.execute("scrapy crawl sfw".split())》》middlewares.py -->随机请求头中间件》》spiders...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。