文章目录
一、问题一的分析
1.1 总体分析
产品需求量一般受到许多其他因素的影响,例如产品价格、产品所在区域、销售方式、产品品类、不同时间段、节假日、促销日以及季节因素等,因此需要考虑这些因素对产品需求量的影响,以便更准确地预测和分析产品需求趋势。本文主要根据问题一所给的8个主题进行探索性分析。
训练集提供了597694个样本数据,包含订单日期、销售区域编码、产品编码、产品大类编码、产品细类编码、销售渠道名称、产品价格以及订单需求量8个特征。本文首先对原始数据集进行数据预处理,如缺失值及异常值分析,随后分析数据集是否存在重复数据,进一步对连续型变量价格和需求量进行正态性检验。由于数据集中所包含的是产品价格、产品所在区域、销售方式以及产品品类信息,而不包含不同时间段、节假日、促销日以及季节因素的相关数据,需要根据订单日期进行编码处理。利用处理好的数据,进一步利用统计分析方法来探究不同因素对需求量的影响以及相关特性。
在数据预处理方面,我们主要从下面几个方面入手:
- 缺失值及异常值分析
- 重复值分析
- 价格及需求量的正态性检验
- 训练集相关特征编码
1.2 不同价格对需求量的影响
- 相关性分析
- 价格—需求曲线
1.3 不同区域对需求量的影响
- 正态性检验,包括但不限于:不同区域需求量的频率分布和不同区域需求量的K-S检验和W检验
- 不同区域需求量的Kruskal-Wallis检验
- 不同区域需求量的统计分析