在本报告中,我将对新零售无人智能售货机的商务数据进行分析,以帮助我们更好地了解销售趋势、商品表现和用户行为。这份报告旨在提供关键发现,支持决策制定和业务优化。
项目目标
- 对销量、库存、盈利三个方面可视化分析预测2018年1月商品销量
- 为每台售货机所销售的商品贴上标签
项目任务
- 数据与初开与统计分析
- 数据可视化
- 地区画像
- 销售额的预测
- 撰写报告及提交文件
数据提供
- 附件1:从2017年1月1日至2017年12月31日5台自动售货机的商品销售数据
- 附件2:商品分类
任务一、数据预处理与分析
1.1:根据附件1的数据,提取每台售货机对应的销售数据,保存在csv文件中
首先导入文件附件1
根据数据框中的列名地点来提取出每台售货机对应的销售数据
将提取出的数据保存在csv文件中
1.2:计算每台售货机不同月份的以及总的交易额和订单量
提取出每台售货机每个月份的数据
根据所提取出的数据计算出每台售货机不同月份的交易额,遍历每台售货机每个月的应付金额,并且累加出交易额
根据所提取出的数据计算出每台售货机不同月份的订单量,统计每台售货机不同月份的数据中的行数,也就是订单量
将提取的数据以及计算出的交易额和订单量集合成数据框
将结果保存在scv文件中
计算5台售货机总的交易额以及订单量
1.3:计算每台售货机每个月的每单平均交易额与日均订单量,以表格形式体现在报告中
利用上一步的交易额和订单量来计算每单平均交易额与日均订单量
每单平均交易额=每月交易额/每月订单量
日均订单量=每月订单量/当月的天数
将计算的每台售货机每个月的每单平均交易额与日均订单量集合成数据框
将该数据框保存在csv文件中
表格体现
任务二、数据分析和可视化
2.1:绘制2017年6月销售前5的商品销量柱状图
首先导入文件附件1
提取出2017年6月的销售数据
将2017年6月的销售数据中的商品和应付金额提取出来
统计出2017年6月的商品销售数量
商品销量=商品销售数量/商品单价
根据商品销量进行降序排序,根据商品销量进行切片提取出商品销量前五的数据
绘制2017年6月销售前5的商品销量柱状图
2.2:绘制每台售货机每月总交易额折线图
导入每台售货机每月总交易额文件df_A、df_B、df_C、df_D、df_E
绘制每台售货机每月总交易额折线图
2.3:绘制交易额月环比增长率柱状图
月环比增长率(%)=(本月数-上月数)/上月数*100%
自定义函数MoM()计算月环比增长率
计算每台售货机交易额月环比增长率并集合成数据框
绘制每台交易额月环比增长率柱状图
A台售货机交易额月环比增长率柱状图示例
2.4:绘制每台售货机毛利润占总毛利润比例的饼图(假设饮料类毛利率为25%,非饮料类为20%)
首先导入文件附件1和附件2
自定义函数将附件1的商品的大类添加到数据框中,创建一个空列表接收商品大类数据,再新增一大类列到附件1的数据框中
将新的数据框按照大类,将饮料类和非饮料类提取出来,分别计算毛利润
根据两个大类的毛利润计算出总的毛利润
提取出每台售货机的数据按照上述的方法计算出每台售货机毛利润
根据计算出的每台售货机的毛利润以及总的毛利润绘制每台售货机毛利润占总毛利润比例的饼图
2.5:绘制每月交易额均值气泡图,横轴为时间,纵轴为商品的二级类目
自定义函数将附件1的商品的二级类添加到数据框中,创建一个空列表接收商品大类数据,再新增一二级类类列到附件1的数据框中
遍历应付金额列计算每月交易额
绘制每月交易额均值气泡图
2.6:绘制售货机C台6、7、8月订单量的热力图,横轴以天为单位,纵轴以小时为单位。写出结论
提取出售货机C台6、7、8月订单量的数据文件
6、7、8三个月总共92天,以每七天为一段,计算订单量,合集数据成数据框
根据此数据框中的数据绘制售货机C台6、7、8月订单量的热力图
任务三、生成各自动售货机画像
3.1:分析各售货机商品销售数据总结规律,给出每台售货机饮料类商品标签,结果保存在csv文件中
提取每台饮料类商品销售数据
统计计算每种商品的订单量
根据订单量给商品贴标签,订单量大于100为热销商品,订单量小于100大于50为正常商品,订单量小于50为滞销商品
3.2:在任务3.1的基础上进行标签拓展,依据标签生成完整的售货机画像,结果保存在csv文件中。
热销商品占所有商品的百分比大于30%时,该台售货机画像为热门。热销商品占所有商品的百分比小于30%且大于20%时,该台售货机画像为正常。热销商品占所有商品的百分比小于20%时,该台售货机画像为冷门。
售货机 | 画像 |
A | 冷门 |
任务四、业务预测
4.1:预测未来销售额的原理是?是否可以根据附件提供的数据对每台售货机的每个大类商品在2018年1月的交易额进行预测?
预测未来销售额的原理通常涉及使用统计学、机器学习或时间序列分析等方法来建立模型。下面是一些常见的原理和方法:
1.时间序列分析:
使用历史销售数据,分析时间趋势、季节性和周期性等模式。
常见的时间序列模型包括ARIMA(差分自回归移动平均)、Exponential Smoothing等。
2.回归分析:
考虑各种影响销售额的因素,如广告投入、促销活动、季节性、经济指标等。
使用线性回归或其他回归模型来建立这些因素与销售额之间的关系。
3.机器学习:
利用机器学习算法,如决策树、随机森林、支持向量机、神经网络等,来学习复杂的非线性关系。
特征工程是重要的一步,需要选择和提取对销售额有影响的特征。
4.深度学习:
如果数据规模足够大,深度学习模型如循环神经网络(RNN)或长短时记忆网络(LSTM)可以用于捕捉时间序列中的长期依赖关系。
5.集成方法:
结合多个模型的预测结果,例如使用集成学习方法(如Bagging、Boosting)来提高整体预测性能。
6.交叉验证和调参:
使用交叉验证来评估模型性能,确保模型对未来数据的泛化能力。
调整模型的超参数以优化预测性能。
7.实时更新:
对于动态环境,需要实时更新模型以适应新的数据和变化。
无论使用哪种方法,都需要确保模型在历史数据上有足够的拟合能力,并在未来数据上有良好的泛化能力。模型的选择取决于数据的性质、问题的复杂性以及可用的计算资源。
我认为附件所给出的数据不足以支撑预测工作。
4.2:若可以进行预测,请给出过程以及结果;若认为附件所给出的数据不足以支撑预测工作,应该向经营者提出哪些方面的数据需求?
要预测自动售货机2018年1月的交易额,我需要以下类型的数据:
1.自动售货机的位置信息:
每台自动售货机的具体位置,以了解其所在地区的经济状况、人口密度等因素。
2.节假日和特殊事件信息:
考虑在历史交易数据中标记节假日、促销活动或其他特殊事件,因为这些因素可能影响交易额。
3.竞争对手信息:
如果附近有其他竞争性的自动售货机或商店,可能需要考虑这些因素对销售额 的影响。
4.人流量信息:
如果可能的话,收集每个自动售货机所在地区的人流量信息,这可以帮助理解潜在的客户数量。
小结
分析了各个产品的销售情况,识别畅销产品和滞销产品。这有助于调整库存,优化产品组合,并提高销售额。基于销售数据的库存管理,确保热销商品充足,减少滞销商品的库存。通过设置智能的补货策略,提高库存周转率。