爱彼迎数据分析

本文通过Python和R语言对Airbnb数据进行分析,包括calender数据集的价格季节性、listings数据集的房源特征、reviews数据集的评论趋势以及房价和评论数的预测。发现3-4月和7-10月为旺季,周五周六价格较高,大部分房源价格集中在200-400元。随机森林预测房间价格效果不佳,而评论数预测精度较高。
摘要由CSDN通过智能技术生成

简单的python爱彼迎数据分析

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

导入需要的库
1.calender数据集分析

calendar = pd.read_csv(r'C:\Users\12435\Desktop\shujufenxi\数分清华\aibiying\calendar_detail.csv')
calendar.head()

导入数据集并查看
在这里插入图片描述

calendar.info()

在这里插入图片描述
首先将价格转换为为浮点数

calendar['price']=calendar['price'].str.replace(r'[$,]','',regex=True).astype(np.float32)
calendar['adjusted_price'] = calendar['adjusted_price'].str.replace(r'[$,]','',regex=True).astype(np.float32)
#将日期转换为日期格式
calendar.date=pd.to_datetime(calendar.date,format='%Y-%m-%d')
#添加月份和星期
calendar['month']=calendar.date.dt.month
calendar['weekday'] = calendar.date.dt.weekday+1
calendar.head()
#月份与价格的关系
month_price = calendar.groupby('month')['price'].mean()
sns.barplot(month_price.index,month_price.values)
plt.ylim(600,700)

在这里插入图片描述
可以看到3.4月淡季价格较低,78月暑假10月国庆价格较高.

#星期与价格的关系
weekday_price = calendar.groupby('weekday')['price'].mean()
sns.barplot(weekday_price.index,weekday_price.values)
plt.ylim(600,700)

在这里插入图片描述
周五周六价格较高.
分析一下价格占比

sns.distplot(calendar[calendar['price']<1000]['price'])

在这里插入图片描述

排除一些异常值后,可以看出条形图呈右偏分布.大部分房屋价格都在200-400元左右
2.listings数据集分析

listings = pd.read_csv(r'C:\Users\12435\Desktop\shujufenxi\数分清华\aibiying\listings_detail.csv')
listings.head()

在这里插入图片描述

#数据集特征较多,有106个,通过将列名转换为列表查看完整特征.寻找感兴趣的特征进行处理.
listings.columns.to_list()

在这里插入图片描述
修改金额列的数据类型

listings['price'] = listings['price'].str.replace(r'[$,]','',regex=True).astype(np.float32)
listings['cleaning_fee'] = listings['cleaning_fee'].str.replace(r'[$,]','',regex=True).astype(np.float32)
listings['cleaning_fee'].head()
#存在空值,说明有些旅馆是不需要小费的,用0填充即可
listings['cle
  • 0
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
美国著名共享民宿网站 Airbnb 开放的民宿信息和住客评价数据,包括民宿的位置、房间、配置、价格、住客的评分和自然语言评论等。目前Airbnb开放数据的城市如下表所示。 城市名称 省份和地区 所在国家 Amsterdam North Holland The Netherlands Antwerp Flemish Region Belgium Asheville North Carolina United States Athens Attica Greece Austin Texas United States Barcelona Catalonia Spain Berlin Berlin Germany Boston Massachusetts United States Brussels Brussels Belgium Chicago Illinois United States Copenhagen Hovedstaden Denmark Denver Colorado United States Dublin Leinster Ireland Edinburgh Scotland United Kingdom Geneva Geneva Switzerland Hong Kong Hong Kong China London England United Kingdom Los Angeles California United States Madrid Comunidad de Madrid Spain Mallorca Islas Baleares Spain Manchester England United Kingdom Melbourne Victoria Australia Montreal Quebec Canada Nashville Tennessee United States New Orleans Louisiana United States New York City New York United States Northern Rivers New South Wales Australia Oakland California United States Paris France France Portland Oregon United States Quebec City Quebec Canada San Diego California United States San Francisco California United States Santa Cruz County California United States Seattle Washington United States Sydney New South Wales Australia Toronto Ontario Canada Trentino Trentino-Alto Adige_Südtirol Italy Vancouver British Columbia Canada Venice Veneto Italy Victoria British Columbia Canada Vienna Vienna Austria Washington D.C.District of Columbia United States
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值