目标:找出合适的预测顾客流量的模型
主要步骤:
1. 数据预处理。数据合并、缺失值处理、异常值处理。
2. 特征提取。指数加权移动平均法、差分进化算法、one-hot编码、特征提取和特征生成。
3. 建立模型。建立多种回归模型。
4. k折交叉验证。得到各模型的拟合效果。
5. 评价模型。根据交叉验证结果和统计检验结果对比得到一种拟合效果最好、误差最小的模型。
1. 数据预处理
1.1 导入数据集,整理后合并数据
1.2 整理数据(缺失值、异常值)
检查是否存在缺失值、异常值,并对异常值进行处理(替换为非异常值里的最大值)。