滴滴出行城市运营数据,来源:和鲸社区 - Kesci.com
1.背景描述
数据集为两个Excel文件,其中test为某次A/B测试相关数据,city为某城市运营数据。
数据说明
city.xlsx
date:日期
hour:时点
requests:请求数
trips:订单数
supply hours:可服务时长
average minutes of trips:平均订单时长(分钟)
pETA:顾客预计等待时长
aETA:顾客实际等待时长
utiliz:司机在忙率
2.数据清洗
- 缺失值处理(3种处理方式)
①直接删除
②填充平均值或者出现次数最多的值
③填充预测模型预测值
excel中定位空值(快捷键Ctrl+G,选择定位条件为空值),观察缺失值属性,选择处理方法。