airbnb爱彼迎python爬虫与简单分析

本文介绍了一位房东使用Python爬虫获取Airbnb成都房源信息的过程,包括利用requests和lxml库解析URL和XPath路径。分析发现,整套公寓房型占比大,1室房源较多,评价数可反映房源销售热度,特定设施的房源价格和销量较高,而远离市区的高新区和机场也有高价热卖房源。
摘要由CSDN通过智能技术生成

目的

作为一个挂了几套公寓在airbnb上的小房东,又作为一个喜欢分析数据的小孩子,当学习爬虫的过程中当然要选择爱彼迎这个网站来试手;在网上看到一个大神po的一长串的代码,用了之后的确可以马上爬取,但爬到的内容不是我想要的,而且我总感觉复杂了很多,于是我开始用我现有的知识来进行爬取;

方法

requests lxml
1.分析网页url构建17页的url代码
很容易发现规律url=‘https://www.airbnb.cn/s/chengdu/homes?query=chengdu&items_offset=’+{0,18,36.....}
2.分析网页我们需要的xpath路径
通过审查元素 我们想要的路径为
公寓名://div[@class=’_qhtkbey’]/text()
评价数:///div[2]/div[1]/div/span[2]/text()#我期望用评价数来作为房源的销售热度来进行分析,因为airbnb并不会显示交易量
显示价格://
/div[2]/div[2]/div/div/div[1]/div/span/span/span/span[1]/span[2]/text()
房源类型

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值