考虑各个类别的销售情况
(2,2,1)代表两列两行中的第一个,(2,2,1)代表两列两行中的第二个,以此类推。
通过观察比较各个类销售量与销售额占比的关系,基本可以判断他们是正相关的。这也是符合常识的。
在大类中,护肤品的销量远胜化妆品以及其他商品。而在小类之中,清洁类的护肤品销量最高,其次是补水类的护肤品。
接下来用seaborn包给出每个店铺各个大类以及各个小类的销量销售额
先观察销量,各店小类中销量最高的是相宜本草的补水类商品以及妮维雅的清洁类商品,这两类销量很接近。而销售额上,相宜本草的补水类商品比妮维雅的清洁类商品要高得多,这显然是商品平均单价不同所导致的。由于不同的类别使用量也不同,销量自然也会有所区别,所以相对于比较每个店铺的不同类别的销售量,比较每个不同类别的各店铺的销售量应该更有价值。
事实上可以看出相宜本草在面霜、乳液、精华、补水、化妆水、眼部护理以及防晒类中都是销量最高的。美宝莲在口红、眼部彩妆也都是卖的最好的。而妮维雅在清洁类中一骑绝尘。在这里我们就可以用上之前提取出的新特征-是否男性专用。因为清洁类显然是有男性市场的。
关于性别
接下来考虑性别因素,了解各类产品在男性消费者中的销量占比
分析与之前的饼图相比:
男士的销量基本来自于清洁类,其次是补水类。而这两类正是总销量中占比最高的两类。
非男士专用中,补水类成为了销量最高的类别,清洁类降到了第二位。
男士专用的销量以及销售额占比都比较低。
显然,在没有区分性别的情况下,由于清洁类是男性女性通用,所以占得销量最高是理所应当的。而非男士专用中,女性消费者较多,所以补水类一跃成为最高销量。尽管就整个销量而言,男士专用的占比不高,但是这也说明男性市场是一个值得发展急需拓宽的点。如果增加更多关于男性护肤品的推广,有可能会吸引更多的男性消费者从而增加销量。所以进一步分析,各个店铺的男性专用商品的销量。
loc目的是为了筛选数据。
男士专用护肤品的销售量前三名分别是:妮维雅,欧莱雅,相宜本草。所有男士商品主要销量来自于护肤品。对于其他类这里暂时不进行分析,因为其产生大概率是basic_data也就是我们的分类集不完善导致的。观察一下男用化妆品的数据,如下:
可以看出基本都是男用唇膏。因为将唇膏归于了口红类,而口红类归于了化妆品类。
各个店铺的男士专用商品的总销量销售额
欧莱雅和妮维雅占据了男性专用商品的绝大部分市场,不管是销量还是销售额。这一点在不区分是否男性专用的商品中是有所出入的。欧莱雅在无论在哪个方面都表现的很好,虽然销量在非男士专用商品里属于一般水平,但销售额都名列前茅。而妮维雅在非男士专用商品里的销售情况就很差了,这说明妮维雅主打的就是男士专用商品。而相宜本草在非男士专用商品的表现还是遥遥领先,其在男士专用商品中也排在第三位,虽然和前两名都有比较大的差距。
关于时间
观察两个折线图,其走势是相同的,因为整个销量与销售额应该是成正相关的。由图可知:
在9日单日销售量达到峰值,而在11日达到最小
10日之前的波动趋势相对稳定,在11日有一个急剧的下降
11日过后又开始缓慢的增长。由于统计的日期有限,无法判断这种趋势是长期的还是短期的。
所以,双11活动反而在双11当天的销量有剧烈的下滑,其原因大概率是双11的预热、预售活动等等。在临近双11时,9日销量达到最高,因为更临近了,所以关注的人更多,购买的人更多。但是在10日有所下降,和双11下降有相同的理由,是人们都主观的认为双11当天的购买人数太多,可能会有网络、平台卡顿导致无法成功下单的忧虑,所以反而造成了双11当天销量急剧下滑。而双11过后又开始有了销量增长,有可能是店铺持续优惠,比如赠送满减卷,让许多已经消费过的消费者再次消费。
对评论数进行分析
悦诗风吟的评论数远高于其他。而前面的分析中,悦诗风吟的所有商品数量是第一名,但其销量只在第三位。反观相宜本草,销量远高于其他,然而评论数相对销量却过低。所以我们考虑一个新的指标:每个店铺平均每多少单能得到一条评论。这个指标上,相宜本草和蜜丝佛陀最高。而理论上,销量与评论应该是一个正比的关系。这些平均多少单一条评论的指标能否反映店铺存在水军刷单的问题?相宜本草的该指标为28左右,而大多数品牌都在5-10左右,相宜本草是其他的大概4倍。所以是否可以推论,该指标过高的店铺存在刷单,刷销量的行为。如果能获得更详细的数据,例如好评率,好评格式等等,这也是一个可以探讨的问题。
总结分析
平均每单价格低的店铺的总销量、销售额都高于均价更高的。价格便宜是消费者考虑的最多的一个点。销量最高的相宜本草的均价就很低,同时它的销售额也是最高额的。而均价较高的类中,只有雅诗兰黛的销售额相对客观。对于一些中高端商品,可以考虑适当降价来吸引更多消费者。而一些低端商品可以考虑多推广来提高知名度获取销量。
所有大类中,护肤品类的销量最高,其次是化妆品类。所有小类中,清洁类、补水类分别是销量的前二名。
男士专用的商品中,护肤品销量最高,而化妆品类中主要是唇膏。并且妮维雅占据了男士专用的大部分市场。
平均每多少单一条评论这个指标,相宜本草过高了,是评论数最多的悦诗风吟的4倍。可能存在刷单等现象。
不同的日期销量也不同。在双11销量反而有一个剧烈的下滑。原因可能是预热活动导致了消费者提前消费,并且由于消费者往往会主观的考虑到双11当天的网络、平台会卡顿,一般都会提前下单来避免“高峰”,虽然这个高峰并不存在。而在双11之后销量又有了小幅度的增长,可能跟商家的持续优惠等各种活动有关。所以商家应该把目光放在双11之前,尽量的吸引消费者消费来增加销量,不要局限于双11当天。在双11之后可以通过类似双11购物返满减卷,来刺激二次消费。
此项目过程流程大概为:
数据处理与筛选
对原始数据进行中文分词,筛选出护肤品中的面霜等产品。
根据是否为男士专用进行分类,填写相应标记。
计算销售额,公式为单价乘以销售数量。
数据可视化
使用嵌套柱形图展示不同店铺和主类别的总销售额
通过HUE参数区分主类别和子类别。
绘制饼图展示男士和女士专用产品的销售量占比。
分析结果
男士专用产品中,清洁类和补水类占比最高。
女士专用产品中,补水和清洁类仍占较大比重,此外还有底妆,眼部彩妆和口红。
男士专用产品的销售量占总销售量的18.16%,销售额占10%。
产品销售分析
男士专用护肤品主要集中在妮维雅和欧莱雅。
女士专用产品的销量和销售额较为均衡,相宜本草、美宝莲、悦诗风吟和欧莱雅表现突出。
时间序列分析
双11期间,销售量在11月5日和11月9日达到高峰,销售额在11月10日达到顶峰。
商家应在销售量高峰前几天安排好促销活动,以最大化销售额。
评论数分析
对店名进行分类,选取相应数据进行评论数分析。
总结
数据分析和可视化是理解和利用数据的重要工具。
通过不同维度的分析和图表展示,可以发现数据中的趋势和消费者偏好。
结合时间和产品类别的分析,可以为商家提供有价值的市场策略建议。