共享自行车需求预测
本案例提纲:
1、了解题目背景
2、描述性分析
3、特征工程
4、模型选择
5、基于R实现模型
1、题目背景及要求
题目背景:
大红色的“首都自行车共享”,2013年11月开始,出现在美国首都华盛顿哥伦比亚,设立了一百多个无人看管的自行车出租点。政府积极鼓励地方发展节约能源的交通方法,希望人民生活更方便、更健康。由此,联邦政府运输部资助600万美元,启动了“首都自行车共享”项目。在美国,骑车人和行人的权益都受到政府和各方保护,有时在优先权上更甚于开汽车,在不少城市都设有安全步道系统。
题目要求:
数据来源:华盛顿自行车共享计划中的自行车租赁数据
分析共享自行车和天气之间的关系
评价标准:预测的出租书量与真实的出租数量
以下是本题的数据字典:
英文字段 | 中文字段 | 说明 |
datetime | 日期时间 | 小时日期+时间戳 |
season | 季节 | 1=春季,2=夏季,3=秋季,4=冬季 |
holiday | 假期 | 是否被认为是假日 |
workingday | 工作日 | 是周末还是假期 |
weather | 天气 | 1:干净,少云,部分多云,部分多云 2:雾+多云,雾+破碎的云雾,雾+少云,雾 3:小雪,小雨+雷暴+分散的云彩,小雨+分散云 4:大雨+冰粒 |
temp | 温度 | 摄氏温度 |
atemp | atemp | “感觉”摄氏温度 |
humidity | 湿度 | 相对湿度 |
windspeed | 风速 | 风速 |
casual | 非注册 | 新的非注册用户租车数 |
registered | 注册 | 新的注册用户租金车数 |
count | 数量 | 总出租的数 |
2、描述性分析
通过对季节、天气、湿度、风速、假期、工作日、温度、体感温度的租车数量的直方图,观察租车数的影响因素,并提出假设。
不同季节租车数的直方图
不同天气租车数直方图