一 题目
随着我国消费市场的不断发展,市场上的消费模式已经逐步由“以物为主”转变为“以客为主”。在新零售行业,性价比不再是顾客衡量是否购买物品的唯一标准,人们的需求也不仅仅是单一的追求实用性,而是更多的考虑时尚性,把注意力放在“个性化、时尚、美观”等方面。在这类特殊需求的推动下,新零售企业的生产模式逐步向多品种、小批量迈进,这让商场内零售店铺里的饰品和玩具等种类变得更加琳琅满目,同时也给零售行业的库存管理增加了很大的难度。如何根据层级复杂,品类繁多的历史销售数据,以区域层级,小类层级乃至门店 skc(单款单色)层级给出精准的需求预测,是当前大多数新零售企业需要重点关注并思考的问题。你们的团队将从 3 个方向为新零售企业解决“精准需求预测”问题贡献一份力量。请基于附件的数据,思考并解决以下 4 个问题:
问题 1:试分析 2018 年国庆节,双十一,双十二和元旦这四个节假日内各种相关因素对目标 skc 的销售量的影响,可考虑产品销售特征,库存信息,节假日折扣等因素。其中,目标 skc 为销售时间处于 2018 年 7 月 1日至 2018 年 10 月 1 日内且累计销售额排名前 50 的 skc。
问题 2:试结合上述分析结果,预测给定区域内目标小类在 2019 年 10月 1 日后 3 个月中每个月的销售量,给出每个月预测值的 MAPE。其中,目标小类为历史销售时间处于 2019 年 6 月 1 日至 2019 年 10 月 1 日内且累计销售额排名前 10 的小类。
问题 3:为了满足企业更加精准的营销需求,试着建立相关数学模型,在考虑小类预测结果的同时,预测目标小类内所有 skc 在 2019 年 10 月 1日后 12 周内每周的周销量,并给出每周预测值的 MAPE(可以考虑 skc 销售曲线与小类销售曲线之间的差异)。
问题 4:请给企业写一份推荐信,向企业推荐你的预测结果和方法,并说明你们的方案的合理性以及后续的优化方向。
二 解题思路与示例代码
问题一
-
数据准备:
- 导入并整理销售流水数据 (sale_info.csv)、产品信息表 (prod_info.csv)、库存数据 (inv_info.csv) 和节假日信息表 (holidays_info.csv)。
-
筛选目标 skc:
- 从销售流水数据中选择销售时间在2018年7月1日至2018年10月1日内,且累计销售额排名前50的 skc。确保清理和筛选数据以去除异常值和确保数据质量。
-
特征工程:
- 从产品信息表、库存信息表中提取与目标 skc 相关的特征,如产品属性、库存情况等。
- 根据节假日信息表,标识出国庆节、双十一、双十二、元旦等日期,以便后续分析。
-
多元回归分析:
- 构建多元线性回归模型,以目标 skc 的销售量作为因变量&#x