全球城市计算AI挑战赛
信息
训练:
- 开放了20190101至20190125共25天地铁刷卡数据记录,共涉及3条线路81个地铁站约7000万条数据作为训练数据(Metro_train.zip),供选手搭建地铁站点乘客流量预测模型。
- 训练数据(Metro_train.zip)解压后可以得到25个csv文件,每天的刷卡数据均单独存在一个csv文件中,以record为前缀。如2019年1月1日的所有线路所有站点的刷卡数据记录存储在record_2019-01-01.csv文件中,以此类推。
- 同时大赛提供了路网地图,即各地铁站之间的连接关系表,存储在文件Metro_roadMap.csv文件中供选手使用。
测试:
- 测试阶段,大赛将提供某天所有线路所有站点的刷卡数据记录,选手需预测未来一天00时至24时以10分钟为单位各时段各站点的进站和出站人次。
- 预选赛阶段,测试集A集上,大赛将提供2019年1月28日的刷卡数据(testA_record_2019-01-28.csv),选手需对2019年1月29日全天各地铁站以10分钟为单位的人流量进行预测,淘汰赛和决赛将分别更新一批新的数据测试集B集和测试集C集。
关键点
对于userID,在payType为3时无法唯一标识用户身份。即此userID可能为多人使用,但在一次进出站期间可以视为同一用户。
因stationID为54的数据缺失,评测时stationID为54的项会被忽略,均不纳入评测范围。