一、赛题任务
赛题给定多个房屋对应电力消耗历史N天的相关序列数据等信息,预测房屋对应电力的消耗,预测结果以 mean square error 作为评判标准。数据集字段为id(房屋id)、 dt(日标识)、type(房屋类型)、target(实际电力消耗)。
二、探索性数据分析
1、不同type类型对应的target的柱状图
2、按dt为序列关于target的折线图
三、时间序列预测模型
时间序列预测问题的方法分为传统时间序列模型、机器学习模型和深度学习模型等多种建模方法。传统时间序列模型包括自回归模型(AR)、移动平均模型(MA)、自回归滑动平均模型(ARMA)、差分整合移动平均自回归模型(ARIMA)及季节性差分整合移动平均自回归模型(SARIMA)。机器学习模型有基于决策树的集成学习方法XGBoost、LightGBM等,通过迭代地构建多个弱预测器组合成强预测器。深度学习模型有循环神经网络(RNN)、长短期记忆网络(LSTM)、Transformer模型等。
baseline使用均值作为结果数据,构建了一个经验模型:
baseline的模型简单,对于稍复杂的时间序列数据,预测能力有限。接下来将在机器学习模型和深度学习模型中选择具有更好的预测能力的模型,并尝试试验混合模型的预测能力。