文章目录
一、问题一的分析
1.1 总体分析
产品需求量一般受到许多其他因素的影响,例如产品价格、产品所在区域、销售方式、产品品类、不同时间段、节假日、促销日以及季节因素等,因此需要考虑这些因素对产品需求量的影响,以便更准确地预测和分析产品需求趋势。本文主要根据问题一所给的8个主题进行探索性分析。
训练集提供了597694个样本数据,包含订单日期、销售区域编码、产品编码、产品大类编码、产品细类编码、销售渠道名称、产品价格以及订单需求量8个特征。本文首先对原始数据集进行数据预处理,如缺失值及异常值分析,随后分析数据集是否存在重复数据,进一步对连续型变量价格和需求量进行正态性检验。由于数据集中所包含的是产品价格、产品所在区域、销售方式以及产品品类信息,而不包含不同时间段、节假日、促销日以及季节因素的相关数据,需要根据订单日期进行编码处理。利用处理好的数据,进一步利用统计分析方法来探究不同因素对需求量的影响以及相关特性。
在数据预处理方面,我们主要从下面几个方面入手:
- 缺失值及异常值分析
- 重复值分析
- 价格及需求量的正态性检验
- 训练集相关特征编码
1.2 不同价格对需求量的影响
- 相关性分析
- 价格—需求曲线
本文深入分析了泰迪杯B题中的问题一和问题二,关注产品需求量受价格、区域、销售方式、品类、时间、节假日、促销和季节等因素的影响。通过对数据进行预处理、正态性检验、统计分析,揭示了各因素与需求量的关系,以及在不同预测粒度下模型的预测精度。同时,针对问题二,讨论了在缺少部分特征的情况下如何构建预测模型并评估其效果。
订阅专栏 解锁全文
432

被折叠的 条评论
为什么被折叠?



