好久不写博客了~~~
研究生一年级上学期读了一半了,除了上课就是在宿舍玩游戏。偶尔用caffe给师兄老师提个特征,想这个日子也是无聊呀。之后看到了阿里的数据挖掘比赛公交线路客流预测这个题目,时间战线正好,之前也参加过阿里的挖掘比赛,由于没有坚持到最后而效果一般。这一次一下决心就报名了。如今比赛快完了,写一篇博客记录一下这一个月过程,就算不会获得啥奖励,也算是给自己一个交代吧~
给出的数据是广州市公交线路的历史公交刷卡数据(8月1号到12月31号),天气情况以及线路情况,要求预测未来一周(1月1号到1月7号)的公交车流量数据。下载完数据,写了个py文件统计plot一看。