Question C
题目翻译
问题C:电子商务产品销售预测
随着企业不断产生销售商品,其数据对于企业自身的营销策划、市场分析、物流规划等具有重要意义。然而,有许多因素影响销售预测。传统的基于统计的计量模型,如时间序列模型,并不适合现实。假设太多,导致预测结果不佳。因此,需要更加优秀的智能AI算法来提高预测的准确性,从而帮助企业降低库存成本,缩短交货周期,提高抗风险能力。
附件包含2类数据:商品历史销售数据、商品月度订单数据。商品历史需求销售数据提供商品代码、日期、是否在售、商品销售量。
商品月度订单数据提供商品代码、商品类型、月份、订单数量、月初和月末库存。(标签中空值的含义是指产品在当天没有销量)。
请建立一个数学模型来解决下列问题:
问题1:针对附件中的数据完成数据预处理,并说明预处理方法
问题2:从统计分析来看,月初库存量和月末库存量之间是否存在明显的关系,商品种类对商品库存量有什么影响?
问题3:根据提供的样本建立模型,预测产品未来3个月的销量,并检验预测模型。评价指标(准确度1 )是每个月所有产品的平均准确度。在提交示例中写入您的预测结果,附件给出了需要预测的产品和月份,并且预测的销售量被填入标签中。
问题4:请对数据中存在的其他研究价值进行扩展描述,并根据前面的结论撰写一篇不超过两页的A4论文的商业报告。
http://challenge.xfyun.cn/topic/info?type=product-sales
问题一
对于数据预处理问题,第一步是填补空缺值,这个需要根据题目来具体分析是填写多少,这一题是填写0,也就是对应文中的这一句话,(标签中空值的含义是指产品在当天没有销量)。但是并没有在表格中发现空缺值,应该是数据已经标0了,这跟问题描述有一点点矛盾,在论文中简单描述一下,切忌掠过,第二步剔除问题数据,如果题目中给出了数据要在什么范围,就要进行具体操作了,这题也没有写,这一步就不用进行了。将Commodity demand training set和Commodity monthly order training set中的日期统一,统计每种商品在每一天的销售额是多少,这不用代码也可以做,excel就可以,做到这里利用SPSS简单将其中几个数据做个销售额分析图贴上给评委看看你的分析结果,预处理了就行
问题二
分析两个变量(月初库存量、月末库存量)之间的关系,绘制一种商品的月初月末库存量的散点图,注意绘制了一种两种可能发现不了什么实质性的问题,这也不符合题目说的统计分析,将所有的商品月初月末销售额放到一张散点图就很容易观察了,这里我做的结果是正相关,这也很容易理解吧,月初库存量低,月末库存量怎么可能高,月初库存量高,月末库存量一般也是高吧。这题目应该很好写了,用SPSS来分析
问题三
第三问是预测模型 这类题目根据方法本身的性质可以分为三类, 定性预测方法 时间序列分析 因果关系分析 这种预测模型有很多 ARIMA模型、随机森林模型、狼群算法、LSTM 都能用上,这里可以使用一种,也可以结合使用
问题四
语文建模不用多说了吧 找找商业书格式认真写写没啥问题
总结
数据分析题 挺好做的 思路也很好想 不会的多去知网看看相关文献 对于电商预测的题目之前也有很多数据建模比赛出过类似的题,找找相关优秀论文学习一下别人的写法 拿奖应该挺容易的