【Python数据分析】基于ARIMA 自回归积分滑动平均模型的销售价格&库存分析报告 附完整python代码

资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码
img

完整代码分析

img

同时销售量后1000的sku品类占比中(不畅销产品)如上,精品类产品占比第一,达到66.7%,其次是香化类产品,占比11.90%,远远小于精品类产品,酒水类产品占比7.3%,有税商品免税其他商品和电子类产品分别占比6.40%、6.40%、1.3%,

将数据按照毛利进行排序,毛利前1000和后1000的sku品类占比如下,

img`

img

可以发现按照毛利排序,各品类的sku数量占比区别不如按照销量排序的各品类sku数量占比那么大,其中按照毛利排序的sku前1000,品类sku占比最大的是香化类,其次是精品类,它们占比分别达到33.2%和31.5%,其中占比最小的是免税商品其他类,说明该品类的毛利率相对较小,而毛利率较大的为精品类和香化类,这和品牌有一定关系,人民生活正在慢慢变好,精品类商品能满足大部分人民的精致生活,同时香化类产品受众多为女性,商品需求大,毛利也高。对于毛利sku后1000的商品,其中有税商品和精品类和香化类商品仍然占领霸主位置,原因可能由于对于精品类和香化类的部分商品经常打折来吸引顾客,所以这部分商品的毛利较低,sku后1000商品品类占比最大的为有税商品,占比达到33.00%,由于考虑到税额加上顾客的消费能力,这部分的商品毛利相对低一点,同时香化类和精品类占比也达到25.9%和25.6%,占比最小的为电子产品,占比为1.3%。

分析sku销量前1000和销量后1000商品的毛利率,得到毛利率的条形图如下,

img

从上图可以发现sku前1000商品的毛利率大概在0.2到0.5左右,而sku后1000的商品的毛利率大部分在0.4到0.5左右,可以认为销量高的商品其毛利率未必会比销量低的商品的毛利率高,这给我们销售商品很有启示,对于商品售卖我们未必要一定去打折扣吸引顾客(当然折扣对部分顾客有一定吸引力),对于畅销品我们就没必要去打折,因为商品本身可能就供不应求,这样通过畅销品的提高整个商场的利润,对于不畅销商品,我们也不一定要去打折,对于不畅销商品,可能其受众较小,而对于那部分受众来说,这对于其他人最不畅销的商品对于他们来说可能是必需品,所以也没必要打折,通过保证毛利,也能提高商场的利润。

价格分析

首先将各品类下的大类进行区间划分,拟定划分6个区间,然后计算每个品类下每个大类的每个价格区间的个数,各品类商品的大类价格区间条形图如下,

img

img

img

img

上面4个品类,精品品类、免税其他品类、香化品类、有税品类的价格区间如图,取免税其他品类进行分析说明,首先免税其他品类下面有六个大类,对这六个大类进行区间划分,划分6个价格区间,其中条形图的高度为对应区间的个数,对于所有的大类,其位于低价位的价格区间个数是最多的,说明大多数人的消费能力有限,会偏向于低价位的商品,对于精品品类,其类下的高级珠宝在各个价格区间中价格区间个数相对其他大类会更多一点,说明高级珠宝受价格的影响相对较小,因为高级珠宝的受众基本是固定的,这些顾客不管价格高或者低都是能够消费的起,所以价格对他们影响不大。对于香化类,价格区间个数很大一部分都在最低价格区间内,随着化妆品行业兴起,很多爱美的顾客都选择购买化妆品,但大多数人的消费能力有限,所以低价格的化妆品成为了畅销产品,而且低价格的化妆品价格区间个数远远高于高价格的价格区间个数。对于酒水和电子品类,其对应的大类只有一个,如下所示,对于这两个品类,可以发现酒水品类的低价位远远比其他价位的多,说明便宜酒水的受众很多,而昂贵酒水受众较少,所以对于低价位酒水可以通过促销来促进购买,对于高价位酒水则可以定高价保证利润。对于电子产品,其中等价位及以下的销售区间个数比较多,相当于珠宝酒水来说,人民更愿意在电子产品上花钱,这也是科技给人们带来的便捷之处,但高价位的电子产品的区间个数仍是较少,和人们的消费习惯和消费能力有关。

img

img

接着查看各品类下的各大类的畅销产品价格区间的折扣率,这里在每一个品类中选取一个大类的价格区间折扣进行分析,对于有税品类下的个人洗护大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(35.877, 56.5] 0.6818181818181818

(56.5, 77.0] 0.640625

(77.0, 97.5] 1.0

(97.5, 118.0] 0.8571428571428571

(118.0, 138.5] 0.0

(138.5, 159.0] 0.5

最畅销产品价格区间(56.5, 77.0]

最不畅销产品价格区间(118.0, 138.5]

从上面可以发现最畅销产品价格区间位于低价区间,但其折扣率为0.6,算是较高了,而最不畅销的价格区间,其折扣率为0,结合前面的分析,对于低价产品,我们可以减小我们的折扣率来提高利润。对于不畅销的产品我们可以进行适当的折扣来促进购买,对于电子品类下的家居大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(32.326, 3875.875] 0.9583333333333334
(3875.875, 7696.5] 0.978021978021978
(7696.5, 11517.125] 0.9745347698334965
(11517.125, 15337.75] 1.0
(15337.75, 19158.375] 1.0
(19158.375, 22979.0] 1.0
最畅销价格区间(7696.5, 11517.125]

最不畅销价格区间(19158.375, 22979.0]

和有税品类不同的是,最不畅销产品价格区间为最贵的价格区间,而且最不畅销的产品价格区间达到了百分百,而最畅销产品的价格区间位于中等价位价格区间,折扣率也比较高。说明对于电子产品这一类相当难以进行修补的产品来说,人们更倾向于贵一点的,可能这和人们的消费理念和消费能力有关, 一般来说电子产品作为非易换品,人们更倾向于买好一点,用久一点,所以出现最畅销的反而不是价格最低的。对于精品品类下的服装大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(38.19, 410.342] 0.08333333333333333

(410.342, 780.273] 0.09401709401709402

(780.273, 1150.205] 0.016129032258064516

(1150.205, 1520.137] 0.058823529411764705

(1520.137, 1890.068] 0.3333333333333333

(1890.068, 2260.0] 0.11764705882352941

最畅销产品价格区间(780.273, 1150.205]

最不畅销产品价格区间(1520.137, 1890.068]

同上面一样,最畅销产品价格区间位于非位于最低价价格区间,而最不畅销的产品价格区间位于中间价位价格区间,因为对于服装类来说,每一个人都有需求,而对于消费能力不够的消费者来说,他们大多会选择网购而不会选择去商城购物,而大多数人选择去商城购买衣服的都是具有一定的消费能力,但他们消费能力也是有限,所以最畅销的价格区间是中等价位偏下,而中等价位偏上的价格区间对于消费能力不足的消费者来说性价比不高,而对于消费能力足够的消费者来说又不上档次,所以这个价位处于一个比较尴尬的位置。对于这个区间的产品可以稍微的促销提高销量。

对于酒水品类下的进口酒水大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(6.66, 9378.333] 0.27345591702027344
(9378.333, 18722.667] 1.0
(18722.667, 28067.0] 0.05555555555555555
(28067.0, 37411.333] 0.0
(37411.333, 46755.667] 0.0
(46755.667, 56100.0] 0.0
最畅销价格区间(6.66, 9378.333]
最不畅销价格区间(9378.333, 18722.667]

和上面品类不一样的是,最畅销的产品位于最低价价格区间,由于低价酒类的受众较多,而10000元以下的酒对于普通消费人群来说也不便宜,所以这个价位最畅销,同时折扣也较低,对于最不畅销的商品,是在第二低价价格区间,折扣率为1,而最高价位的酒折扣率为0反而不是最不畅销的价格区间,因为高价酒的受众较少,同时他们也有能力进行消费,所以不需要进行折扣。而最不畅销的价格区间是不受低端客户和高端客户的喜爱,所以不畅销。

对于香化品类下的个人洗护大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(59.07, 215.0] 0.09813084112149532
(215.0, 370.0] 0.0729483282674772
(370.0, 525.0] 0.10810810810810811
(525.0, 680.0] 0.0425531914893617
(680.0, 835.0] 0.25
(835.0, 990.0] 0.10526315789473684
最畅销产品价格区间(215.0, 370.0] 
最不畅销产品价格区间(680.0, 835.0]

同上面一个,畅销产品为虽为低价产品,但其并未是最低价产品,该产品折扣率低,同时不畅销产品为高价产品,但也并非是最高价区间产品,折扣率也低。说明价格并不是决定畅销和不畅销的唯一因素,对于洗护类产品,由于关乎自身皮肤健康,所以相当中等价位的产品比较畅销,对于免税其他商品的书写工具大类,其价格区间的折扣率和最畅销产品和最不畅销产品如下:

(5.879, 2215.883] 0.24
(2215.883, 4412.707] 0.36363636363636365
(4412.707, 6609.53] 0.0
(6609.53, 8806.353] 0.3333333333333333
(8806.353, 11003.177] 0.0
(11003.177, 13200.0] 0.0
最畅销价格区间(5.879, 2215.883]
最不畅销价格区间 (8806.353, 11003.177]
对于书写工具,由于需求较大,人民对其没有过多要求,能写就行,所以人民会倾向于较低价的产品,所以其最畅销的价格区间为最低价价格区间,而最不畅销的是倒数第二贵的价格区间,同样这个区间基本只有有强大消费能力的人去购买,而这类人往往会挑选最贵的去买,所以其成为最不畅销的产品价格区间。

库存分析

资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码

分析各品类下各大类的sku数,以条形图展现,如下

img

img

img

img

img

img

通过分析各大类的sku数可以判断哪些大类商品需要更多的库存,哪些大类商品需要的库存少,对于有税商品中的干杂大类,香化品类中的护肤大类,免税其他品类的玩具大类以及精品品类下的珠宝和钟表大类,他们sku数比较多,可以多放些库存以免缺货。

接着根据28法则,分析各品类下sku金额以及累计金额,结果如下,

img

img

img

img

img

img

从上面的表中可以发现,免税其他品类和有税品类的前20%的商品金额大概占比总的商品金额的60%,而其他四个品类大概占比了80%,符合28法则。

分析每个品类下的期初期末以及平均库存,结果如下

img

免税其他品类的营养保健类、干杂类库存较多,而期初库存全为0,根据上面的分析,书写工具和玩具的sku数较多,可以加大这两类库存

img

进口酒类期初库存也为0,可以加一些期初库存

img

精品品类的珠宝和钟表类的sku数较多,而上方珠宝的库存较少,可以加大该类的品类库存

img

对于家居品类,可以加一些期初库存。

img

对于有税商品,干杂类珠宝sku数较多,可以加大珠宝类的库存,根据上图,珠宝类的库存较少,可以加强库存。

img 标题

对于香化品类,护肤和香水大类的sku数较多,而上图香水库存较少,可以加强该库存。

使用价格区间来分析库存。

通过分析最畅销库存以及最不畅销库存来调配商品。由于品类过多,选取一部分分析,结果如下。

有税品类的个人洗护类:

img

电子品类:

img

精品类

img

酒水类

img

对于这六个品类,除了有税品类下的个人洗护类的不畅销价格区间的库存相对多一点外,其他的最不畅销的价格区间的商品库存都比最畅销的商品库存低许多,说明在不同价格区间的库存来说,库存的配比没有问题,对于精品类,由于其占商品销售很大一部分,所以需要着重的分析,首先需要提高畅销产品的库存,但不一定要减小不畅销产品的库存,因为对于精品类来说,其最不畅销的产品销量可能比其他的类要高,所以可以选择增大畅销产品的库存,同时不动非畅销品的库存。而其他四个看起来正常,他们的库存远远多于最不畅销产品的库存量,在一定程度上认为是合理的。

分析有效库存的各品类的库存数

img

上图为总库存,有效库存,无效库存的条形图,发现有效库存占总库存的绝大多数,接下来分析不同品类下的库存数量,

有税品类的库存如下,有税品类下干杂类sku最多,其库存也最多,库存配比无误

img

电子类,电子类占销售比例也较大,其库存也算较多,库存配比无误,

img

精品类库存图如下,精品类下钟表和珠宝的sku较多,而下面珠宝的库存不多,可以适当提高其库存,相对减少其他库存

img

资源地址:Python数据分析大作业 4000+字 图文分析文档 销售分析 +完整python代码

  • 88
    点赞
  • 58
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 38
    评论
### 回答1: ARIMA(自回归积分滑动平均模型)是一种常用的时间序列分析方法,用于对时间序列数据进行预测和建模。在Python中,我们可以使用statsmodels库来实现ARIMA模型。 首先,我们需要导入所需的库: ```python import pandas as pd import numpy as np import statsmodels.api as sm ``` 接下来,我们需要加载时间序列数据。可以使用pandas库的`read_csv`函数从CSV文件中加载数据,或者使用其他适用的方法加载数据。 ```python data = pd.read_csv('data.csv', parse_dates=['date'], index_col='date') ``` 数据加载后,我们可以通过观察数据的统计特征和绘制时序图来了解数据的性质。 ```python data.describe() data.plot() ``` 然后,我们需要进行时间序列的差分,以使其变得平稳。平稳时间序列的波动性较小,更容易建模和预测。 ```python diff = data.diff().dropna() diff.plot() ``` 接下来,我们可以使用`sm.tsa.ARIMA`函数构建ARIMA模型。 ```python model = sm.tsa.ARIMA(diff, order=(p, d, q)) ``` 在这里,`order`参数是一个三元组,代表ARIMA模型中的(p, d, q)值,分别代表自回归阶数、差分阶数和滑动平均阶数。可以通过对数据的观察和使用模型选择方法(如AIC、BIC)来确定这些值。 完成模型构建后,我们可以使用`model.fit()`函数来拟合模型。 ```python results = model.fit() ``` 然后,可以使用`results.summary()`函数来查看关于模型的详细信息和统计指标。 最后,我们可以使用拟合后的模型对未来的数据进行预测。 ```python forecast = results.forecast(steps=n) ``` 在这里,`steps`参数代表预测的步数,`n`代表需要预测的未来时间点的个数。 以上是基于Python实现的ARIMA模型的简要步骤。根据具体的数据和需求,可能会有一些额外的步骤和调整。 ### 回答2: ARIMA(自回归移动平均模型)是一种常用的时间序列预测方法,可以用于分析和预测各种有规律的时间序列数据。下面是一个基于Python实现ARIMA模型代码示例: 首先,需要安装statsmodels库来实现ARIMA模型: ```python !pip install statsmodels ``` 然后,导入所需的库和模块: ```python import pandas as pd import numpy as np from statsmodels.tsa.arima.model import ARIMA import matplotlib.pyplot as plt ``` 接下来,加载时间序列数据,可以是一个csv文件或一个数组: ```python data = pd.read_csv('data.csv', header=None) ``` 然后,将时间序列数据转换为一维数组: ```python data = data.values.flatten() ``` 接下来,创建ARIMA模型: ```python model = ARIMA(data, order=(1, 0, 1)) # (p, d, q)参数可以根据实际情况进行调整 ``` 然后,训练模型: ```python model_fit = model.fit() ``` 可以通过调用`model_fit.summary()`来查看模型的详细信息。 最后,可以使用训练好的模型进行预测: ```python prediction = model_fit.predict(start=len(data), end=len(data)+n-1) # n为需要预测的时间步长 ``` 最后,可以将预测结果可视化展示: ```python plt.plot(prediction, label='Prediction') plt.legend() plt.show() ``` 以上就是一个基于Python实现的简单ARIMA模型代码示例。需要注意的是,ARIMA模型的参数调整和模型训练过程可能会根据实际数据和问题的不同而有所差异,需要结合具体情况进行调整和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 38
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

温柔说给风

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值