【第十一届泰迪杯B题】问题一和问题二的分析

一、问题一的分析

1.1 总体分析

产品需求量一般受到许多其他因素的影响,例如产品价格、产品所在区域、销售方式、产品品类、不同时间段、节假日、促销日以及季节因素等,因此需要考虑这些因素对产品需求量的影响,以便更准确地预测和分析产品需求趋势。本文主要根据问题一所给的8个主题进行探索性分析。

训练集提供了597694个样本数据,包含订单日期、销售区域编码、产品编码、产品大类编码、产品细类编码、销售渠道名称、产品价格以及订单需求量8个特征。本文首先对原始数据集进行数据预处理,如缺失值及异常值分析,随后分析数据集是否存在重复数据,进一步对连续型变量价格和需求量进行正态性检验。由于数据集中所包含的是产品价格、产品所在区域、销售方式以及产品品类信息,而不包含不同时间段、节假日、促销日以及季节因素的相关数据,需要根据订单日期进行编码处理。利用处理好的数据,进一步利用统计分析方法来探究不同因素对需求量的影响以及相关特性。

在数据预处理方面,我们主要从下面几个方面入手:

  1. 缺失值及异常值分析
  2. 重复值分析
  3. 价格及需求量的正态性检验
  4. 训练集相关特征编码

1.2 不同价格对需求量的影响

  1. 相关性分析
  2. 价格—需求曲线

1.3 不同区域对需求量的影响

  1. 正态性检验,包括但不限于:不同区域需求量的频率分布和不同区域需求量的K-S检验和W检验
  2. 不同区域需求量的Kruskal-Wallis检验
  3. 不同区域需求量的统计分析

1.4 不同销售方式的需求量特性

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

旅途中的宽~

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值