酒店数据分析(项目练习_2)

该项目旨在通过数据分析预测酒店预订取消可能性。数据源自kaggle,分析包括基础数据预处理、数据可视化,发现城市酒店预订数量约为乡村酒店的两倍,取消率高,7-8月预订最旺。模型建立后的预测得分达到0.861,未来计划优化模型参数。
摘要由CSDN通过智能技术生成

1.项目摘要说明

项目目的:对于数据分析的练习
数据来源:kaggle
源码.数据集以及字段说明 百度云链接:
https://pan.baidu.com/s/1HY_6OWC247bH-Z7cRJaYdg
提取码:vd3t

本项目分析目标:

  • 对数据进行基础分析 预定需求,入住率,用户,预定时长,房型对比等等
  • 分析是否可以根据之前取消的预订情况来预测酒店预订的可能性
2.对数据的基础分析

准备工作(导入需要的包以及数据集)

#忽略所有警告
import warnings
warnings.filterwarnings("ignore")
import numpy as np
import pandas as pd
data = pd.read_csv('./hotel_booking_demand.csv')
data.shape # (119390, 32) 32个特征,119390行
data.head()
hotel is_canceled lead_time arrival_date_year arrival_date_month arrival_date_week_number arrival_date_day_of_month stays_in_weekend_nights stays_in_week_nights adults ... deposit_type agent company days_in_waiting_list customer_type adr required_car_parking_spaces total_of_special_requests reservation_status reservation_status_date
0 Resort Hotel 0 342 2015 July 27 1 0 0 2 ... No Deposit NaN NaN 0 Transient 0.0 0 0 Check-Out 2015-07-01
1 Resort Hotel 0 737 2015 July 27 1 0 0 2 ... No Deposit NaN NaN 0 Transient 0.0 0 0 Check-Out 2015-07-01
2 Resort Hotel 0 7 2015 July 27 1 0 1 1 ... No Deposit NaN NaN 0 Transient 75.0 0 0 Check-Out 2015-07-02
3 Resort Hotel 0 13 2015 July 27 1 0 1 1 ... No Deposit 304.0 NaN 0 Transient 75.0 0 0 Check-Out 2015-07-02
4 Resort Hotel 0 14 2015 July 27 1 0 2 2 ... No Deposit 240.0 NaN 0 Transient 98.0 0 1 Check-Out 2015-07-03

5 rows × 32 columns

data.info()

在这里插入图片描述

数据预处理
data.isnull().sum()[data.isnull().sum()!=0]#查看数据缺失情况

children 4
country 488
agent 16340
company 112593
dtype: int64

# company缺失值过多,删除该列
data1 = data.drop('company', axis=1)
# agent代表有无旅行社,填充0
data1["agent"]=data1["agent"].fillna(0)
# children这里是携带孩童的个数,是离散值,所以用众数填充
data1["children"]=dat
  • 3
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值