一、背景
Airbnb(爱彼迎)是一个旅游房屋租赁平台,被称为是住房中的ebay或者说是闲鱼。
它整体的商业逻辑其实共享经济的一部分,同样是将个人闲置的资源进行出租,提高闲置资源的利用率,达到利益最大化。
目前,airbnb已经在全球191个国家,65000多个城市中提供住房服务,是一个世界级的品牌。但是是否还有改善的空间呢。
二、分析目的
提出问题:
1、 airbnb的用户具有怎样的特征
2、 Airbnb推广渠道的差别,占比和转化率的不同,是否有调整空间
3、 转化率该如何得到改善,减少用户的流失。
三、数据集概览
数据来源地址: https://link.zhihu.com/?target=https%3A//www.kaggle.com/
c/airbnb-recruiting-new-user-bookings/data
数据集名称: airbnb-recruiting-new-user-bookings(airbnb新用户预订数据)
数据集大小:session.csv(14W*6),train_user.csv(21W*16)
字段理解:
train_user_2
id
id编号
date_account_created
账号创建日期
timestamp_first_active
逗留时间
date_first_booking
首次预订时间
gender
性别
age
年龄
signup_method
注册方式
signup_flow
用户注册页面
language
语言偏好
affiliate_channel
营销方式
affiliate_provider
营销来源
first_affiliate_tracked
注册之前,用户交互的第一个营销广告
signup_app
注册APP来源
first_device_type
设备类型
first_browser
浏览器类型
country_destination
目标国家
seesions
user_id
用户id
action
用户行为埋点
action_type
用户行为类型
action_detail
用户行为描述
device_type
此次对话的设备类型
四、数据清洗
缺失值
Train_user表
1、首次预订时间(date_first_booking)缺失值数量:124543
2、年龄(age)缺失值数量:87990
3、注册前用户交互的第一个营销广告(first_affiliate_tracked)缺失值数量:6065
Session表:
1、用户id(user_id)缺失值数量:3563
2、用户行为埋点(action)缺失值数量:10834
3、用户行为类型(action_type)缺失值数量:192193
4、用户行为描述(action_detail)缺失值数量