选题分析
问题C是一道偏数据分析题目,侧重考察预测类模型。题目中明确提到需要用“更优秀的智能人工智能算法”,明示要用到一些比较新的机器学习模型来完成预测。同时该题目也非常贴心地提供了数据,并分好了训练与测试集,22万的数据量也并不算大,个人笔记本完全可以跑起来。这道题就非常适合对机器学习比较熟悉的小伙伴选择,若想冲奖,单纯的套模型肯定不够好,需要贴合题意的数据预处理,以及多种模型的对比与分析,最好可以多模型融合或者模型创新。
题目翻译
随着公司不断创造商品销售额,其数据对其自身的营销规划、市场分析和物流规划具有重要意义。然而,影响销售预测的因素很多。传统的基于统计的测量模型,如时间序列模型,不适合现实。假设太多,导致预测结果不佳。因此,需要更优秀的智能人工智能算法来提高预测的准确性,从而帮助企业降低库存成本、缩短交货周期,并提高抵御风险的能力。
附件包含两类数据:商品历史销售数据、商品月度订单数据。商品历史需求销售数据提供商品代码、日期、是否销售、商品销售量。商品月度订单数据提供商品代码、商品类型、月份、订单数量、月初和月末的库存。(标签中的空值表示该产品当天没有销售)。
请建立一个数学模型来解决以下问题:
问题1:完成附件中数据的数据预处理,并解释预处理方法。
问题2ÿ