任务描述
需要利用历史流量数据,对未来一段时间内的小时粒度流量进行精准预测,从而为设备缩扩容提供参考依据。本赛题提供多个地市两年内小时粒度的 4G 流量脱敏数据,要求参赛者利用提供的数据,自建算法模型,对未来三个月的流量使用情况进行小时粒度的预测,最终提交预测结果的具体数据。评测指标包括多种准确性指标,同时考虑未来三个月内每日流量峰值预测结果、每日小时粒度预测结果,以及特定节假日期间预测结果,最终用加权的方式对参赛者得分进行计算。
初赛训练数据集包括2017-1-1 00:00:00至2018-11-15 23:00:00期间的流量数据,文件名为data_1 (data_1.csv, data_1.xlsx),复赛训练数据包括2017-1-1 00:00:00至2019-2-20 23:00:00期间的流量数据,文件名为data_2 (data_2.csv,data_2.xlsx),将在复赛时提供。两个阶段各需要参赛者往后预测三个地市95天的小时级流量值(即初赛、复赛分别对三个地市预测2018-11-16 00:00:00至2019-2-18 23:00:00、2019-2-21 00:00:00至2019-5-26 23:00:00的小时级流量
数据来自三个不同的地市:
趋势
异常值的处理&去趋势
分布
预测结果
City A
City B
City C
复赛分数
复赛第10