带你走入Kaggle 竞赛top20%的分析方法

本文介绍了参加Kaggle上的Bike Sharing Demand竞赛,达到前20%成绩的分析方法。强调特征工程的重要性,通过数据探查,发现训练集和测试集的特征,并构建如年、周几、季度、月、小时等时间相关特征。通过组合训练集和测试集,进行特征工程的操作,为模型预测提供强有力的支持。参考了其他优秀选手的分析思路和讨论。
摘要由CSDN通过智能技术生成

Kaggle (Bike Sharing Demand20%

题目https://www.kaggle.com/c/bike-sharing-demand

Github地址:https://github.com/cqychen/mykaggle/tree/master/Bike%20Sharing%20Demand

强调,特征决定结果的高度,模型决定如何逼近这个高度

数据探探

这是一个关于自行车租赁预测的题目,相当于国内的ofo,摩拜单车啦。

You are provided hourly rental data spanning two years. For this competition, the training set is comprised of the first 19 days of each month, while the test set is the 20th to the end of the month. You must predict the total count of bikes rented during each hour covered by the test set, using only information available prior to the rental period.

 

训练集提供了一个月的前19天的数据和使用情况,测试集提供后面20号以后的数据,我们主要的任务就是预测20号以后的使用量。  

<

列名

desc

中文描述

datetime

hourly date + timestamp  

小时日期 和时间戳

season

1 = spring, 2 = summer, 3 = fall, 4 = winter

1:春天  2:夏天  3:秋天  4:冬天

holiday

whether the day is considered a holiday

当天是否是节假日

workingday

whether the day is neither a weekend nor holiday

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值