饭店流量预测
任务目标:对饭店流量指标进行预测
处理步骤
1. 数据预处理。读取各个数据集,对原始数据进行数据预处理,包括缺失值处理、异常值处理和数据变换;
2. 提取特征。对各个数据集进行特征提取,并整合特征;
3. 构建饭店流量预测模型。建立多个模型对饭店流量进行预测;
4. 评价模型。使用混淆矩阵和ROC曲线对各个模型的预测效果进行评估,选择效果最好的那个进行预测。
1.数据预处理
1.1 导入数据集
将各个数据集使用.merge()函数进行合并
1.2 数据预处理
2. 特征提取
2.1 提取假期特征
2.2 使用指数加权移动平均法来提取特征
目的是使得用来建模的数据更有稳定性
2.3 对离散的特征进行one-hot编码
3. 构建饭店流量预测模型
4. 模型评价
通过结果可以看出,增强梯度(GBR)回归模型是所有模型中拟合效果最好的,表现在能解释63%的方差变化,并且各个误差项的值都是最低的。故使用增强梯度模型进行饭店的流量预测。