数据来源:
https://www.kaggle.com/neuromusic/avocado-prices
该数据于2018年5月从Hass Avocado Board网站。数据为2015年至2018年3月全美牛油果零售量和价格扫描数据,这些零售数据直接来自Hass的零售商收银机。
结果分析摘要:
- 牛油果价格呈现周期性波动,每年4-5月单价最低,每年9-10月单价最高。有机牛油果和普通牛油果都遵循这一波动规律。
- 2017年牛油果价格环比增幅超过13%。查询资料后推测主要原因是2017年美国牛油果需求没有降低的情况下,牛油果的主产地墨西哥的产量降低导致2017年牛油果价格上升。
- 大部分市场的销售价格范围在0.9-1.8美元,有机牛油果比普通牛油果价格更贵。
- 通过价格与销量对比可以发现价格普遍偏高时销量保持低位,当销量增加时往往是价格由高向低的拐点。
- 对全美不同城市而言,并不是价格越低的城市销量越高。
- 加利福尼亚是全美最爱吃牛油果的州,加利福尼亚人消费了全美18%的牛油果
- 相关性系数矩阵探索数据相关性
正文
1. 牛油果价格是否有周期性规律?
牛油果价格呈现周期性波动,每年4-5月单价最低,每年9-10月单价最高。有机牛油果和普通牛油果都遵循这一波动规律。
从牛油果单价随时间折线图中可以看出牛油果价格虽然没有完全一致的波动规律,但每年4-5月单价最低,每年9-10月单价最高。且价格有逐年上升趋势。▼
将2015、2016、2017年时间线重叠可更明显看到这一规律。▼
在数据中牛油果品种分为两类:有机牛油果、普通牛油果。
针对不同品种牛油果,同样遵循这一价格波动规律。▼
2. 2017年牛油果价格环比增幅超过13%。2017年销量是否受影响呢?为什么2017年价格会变得这么高?
从(1.)中可以看出2017年的牛油果价格高的离谱。但从牛油果年销量与平均单价折现柱状图中可以看出,2017年美国牛油果销量并没有出现大幅下降。▼
对于2017年价格飞涨问题,查询资料后推测主要原因是2017年美国牛油果需求没有降低的情况下,美国市场牛油果的主产地墨西哥因天气等原因,牛油果产量降低导致2017年牛油果价格上升。▼
3. 美国市场中牛油果大部分的销售价格范围在0.9-1.8美元,有机牛油果比普通牛油果价格更贵。
通过单价-密度图可以看出,大部分牛油果的销售价格范围在0.9-1.8美元。▼
从上文不同品种牛油果随时间变化趋势已经可以看出,有机牛油果价格普遍比普通牛油果价格高。用箱型图同样可以看出。有机牛油果中位比普通牛油果高。▼
4. 通过价格与销量对比可以发现价格普遍偏高时销量保持低位,当销量增加时往往是价格由高向低的拐点。
对销量和平均单价随时间作图。可以发现价格普遍偏高时销量保持低位,当销量增加时往往是价格由高向低的拐点。且普通牛油果与有机牛油果均有这样的规律。▼
普通牛油果:
有机牛油果:
5. 对全美不同城市而言,并不是价格越低的城市销量越高。
在(4.)可以看出牛油果单价与销量有负相关性。那么对美国不同城市而言,是否价格低的城市销量越高呢?
结果是否定的。从不同地区不同地区总销量和平均单价关系图中可以看出,并不是价格越低的城市销量越高。推测销量和不同地区人们对牛油果的喜好程度等因素有关。▼
6. 加利福尼亚是全美最爱吃牛油果的州,加利福尼亚人消费了全美18%的牛油果。
7. 相关性系数矩阵探索数据相关性
计算数据相关性系数,探索是否还有数据相关性,并制作相关性热力图:▼
从热力图中可以看到:
(1)平均单价与总销量成负相关性(已在4.中找出规律)
(2)总销量与总包装袋数成正相关(这比较好理解,销量越大包装袋数越多)
(3)平均单价与牛油果类型具有相关性(已在3.中找到规律,有机牛油果更贵)