下图为baseline的提交结果
DCIC2021算法分析题赛题介绍
共享单车,延伸了城市公共交通脉络,解决了市民出行“最后一公里”问题。然而,随着共享经济模式被越来越多市民接受,成为出行习惯,潮汐现象也随之出现。白天工作、晚上休息的人类活动规律的客观存在,加之上下班时间段的集中,导致早晚高峰“一车难寻”、“无地可停”的供需矛盾。本题希望通过对车辆数据的综合分析,对厦门岛内早高峰阶段潮汐点进行有效定位,进一步设计高峰期群智优化方案,缓解潮汐点供需问题,以期为城市管理部门和共享单车运营方研究制定下一步优化措施提供数据支撑。
赛题任务
任务一 :为更好地掌握早高峰潮汐现象的变化规律与趋势,参赛者需基于主办方提供的数据进行数据分析和计算模型构建等工作,识别出工作日早高峰07:00-09:00潮汐现象最突出的40个区域,列出各区域所包含的共享单车停车点位编号名称,并提供计算方法说明及计算模型,为下一步优化措施提供辅助支撑。
任务二 :参赛者根据任务一Top40区域计算结果进一步设计高峰期共享单车潮汐点优化方案,通过主动引导停车用户到邻近停车点位停车,进行削峰填谷,缓解潮汐点停车位(如地铁口)的拥堵问题。允许参赛者自带训练数据,但需在参赛作品中说明所自带数据的来源及使用方式,并保证其合法合规。(城市公共自行车从业者将发生在早晚高峰时段共享单车“借不到、还不进”的问题称之为“潮汐”现象。本题涉及的“潮汐现象”聚焦“还不进”的问题,识别出早高峰共享单车最淤积的40个区域);;
模型预测任务说明
为更好地掌握早高峰潮汐现象的变化规律与趋势,参赛者需基于主办方提供的数据进行数据分析和计算模型构建等工作,识别出工作日早高峰 07:00-09:00 潮汐现象最突出的 40 个区域,列出各区域所包含的共享单车停车点位编号名称, 并提供计算方法说明及计算模型,为下一步优化措施提供辅助支撑。
城市公共自行车从业者将发生在早晚高峰时段共享单车“借不到、还不进”的问题称之为“潮汐”现象。本题涉及的“潮汐现象”聚焦“还不进”的问题, 识别出早高峰共享单车最淤积的 40 个区域。
赛题数据
- 共享单车轨迹数据
字段 | 含义 |
---|---|
BICYCLE_ID | 车辆编码 |
LOCATING_TIME | 定位时间 |
LATITUDE | 纬度 |
LONGITUDE | 经度 |
- 共享单车停车点位(电子围栏)数据
字段 | 含义 |
---|---|
FENCE_ID | 电子围栏唯一编号 |
FENCE_LOC | 电子围栏位置坐标串 |
- 共享单车订单数据
字段 | 含义 |
---|---|
BICYCLE_ID | 车辆编码 |
LATITUDE | 纬度 |
LONGITUDE | 经度 |
LOCK_STAYUS | 锁的状态(0-开锁,1-关锁) |
UPDATE_TIME | 锁状态更新时间 |
赛题理解
- 对厦门岛内早高峰阶段潮汐点进行有效定位,进一步设计高峰期群智优化方案。
- 引导用户到邻近停车位,进行削峰填谷,缓解潮汐点拥堵问题。
在理解了赛题过后,我们明白了需要预测的目标以及初步构思算法,接下来让我们一起跟着赛题的baseline读取数据以及进行初步查看、构建模型生成首次提交结果吧!
问题合集
-
Q:pip install geohash后导入geohash包时却报错?
A:去python37(此处为自己的python目录)/Lib/site-packages/目录下,吧Geohash文件夹重命名为geohash,然后修改该目录下的init.py文件,把from geohash改为from .geohash即可正常导包。 -
Q:pip install hnswlib时失败
-
A:上网找到前辈的安装包进行手动安装解决。
可以参考此处文章进行下载安装
总结
本次赛题于以往赛题的不同之处在于提交方式的创新,使用sftp进行远程结果文件的上传,因此除了赛题所需工具包的下载问题外,最终结果的上传也需要花费较多力气去研究,不过一回生两回熟,熟练以后便可游刃有余。