Python数据分析之商品数据分析

阅读提示

本文将使用Python语言对市面上火爆的0卡饮料——元气森林气泡水多维度分析,它的味道怎么样?大家是如何评价它的呢?


在这里插入图片描述
提到数据分析的时候,我们可能最先想到的就是柱状图、饼图,高端一点的有词云等等,但总有一些大佬会Diss你 :词云太简单了吧,有点low

1、如何入手

在做数据分析的时候我们通常会遇到两种情况:

1、分析不出结果归咎于数据量不够、维度不够等因素

2、自己不会使用复杂的算法构造模型来预测或分析,也没有去思考如何通过学习来进一步的完成完成分析工作

数据维度和算法的价值当然不言而喻,但总是把分析不出结果和价值的锅甩出去,这种归错于外的思维非常危险,它营造了一种“ 分析不出结果,我也没办法” 的心安理得。

2、选择分析对象

这里我将选用市面上很火的一种0卡饮料,元气森林气泡水来作为本次分析的对象。

那么如何对该商品进行简单且粗暴的分析呢?让我们继续往下进行。

3、明确目标

我们的目标是什么?

我们想要通过这次分析得到什么?

比如我们本次分析的要求是: 基于评价,更好的了解消费者对产品的看法

所以 我们的最终目标就是 “基于评价反馈,量化消费者感知,指导优化产品”


4、对目标进行分解

不知道大家有没有听过一种世界上最牛掰的学习方法:费曼技巧

总结一下的话就是: 用大白话去解释新知识,然后通过这种行为加深自己的理解


“拆” 的艺术大体可以分为两步

第一步是换位思考。

评价来源于买家,买家对产品有哪些方面的需求或者感知呢?

第二步,基于换位的逻辑拆解

这里可以按照模拟购物流程的逻辑来拆解:

首先,气泡水本身有非常强的 知名度 买家或多或少是慕名而来。所以,在购买时,到底有多大比例是冲着气泡水这个名号来的呢?

物流,付款到收货用了几天?派送员态度怎么样,送货上门了吗?

收到货后 包装 怎么样。外包装有没有破损?有没有变形?产品包装是精致还是粗糙?

接下来是 产品体验,拿气泡水来说,日期是否比较新?口味买家是否喜欢?到底好不好喝?0卡的噱头到底有没有用?

品尝饮料之后,我们可以建立对产品的立体感知——性价比。花钱买这个产品到底值不值?这个价位是贵了还是便宜?实惠不实惠?

这样,我们就将 品牌、物流、包装、产品(日期、口味)和性价比五大方面初步展现出来了

5、数据处理

这里我们用一种简单粗暴的方式,按标点把整条评论拆分成零散的模块,再设置一系列预置词来遍历

首先我们查看一下抓取到的评论:

根据标点符号来拆分内容

for i in df['初评内容']:
    result.append(re.split('[::,,.。!!~·`\;; ……、]',i))

看一下拆分后的效果

已经可以看到,初步对用户的评论进行了断句,观察评论不难看出他们的主要内容涉及到品牌(元气水)、物流、口味、性价比等方面,所以这里我们用一个笨办法,依次去遍历内容,如果评论中没有相关内容我们就跳过,有的话再对用户的评论进行情感分析(喜欢或者不喜欢)

我们以口味为例来对用户评论进行遍历:

#产品口味,共三种
if '橘子' in word or '橘' in word :
    judges.iloc[i]['橘子口味'] = 1
elif '白桃' in word or '桃子' in word or '桃' in word:
    judges.iloc[i]['白桃口味'] = 1
elif '青瓜' in word or '黄瓜' in word:
    judges.iloc[i]['青瓜口味']

物流为例来对用户评论进行遍历:

#先判断是不是物流相关的
if '物流' in word or '快递' in word or '配送' in word or '取货' in word or '送货' in word:
    #再判断是正面还是负面
	if '好' in word or '不错' in word or '棒' in word or '满意' in word or '迅速' in word:
    	judges.iloc[i]['物流正面'] = 1
    elif '慢' in word or '龟速' in word or '暴力' in word or '差' in word:
        judges.iloc[i]['物流负面'] = 1

#判断是否包装相关
if '包装' in word or '盒子' in word or '袋子' in word or '外观' in word:
	if '高端' in word or '大气' in word or '还行' in word or '完整' in word or '好' in word or '严实' in word or '紧' in word:
		judges.iloc[i]['包装正面'] = 1
    elif  '破' in word or '破损' in word or '瘪' in word or '简陋' in word:
        judges.iloc[i]['包装负面'] = 1

其他方面就不再一一赘述,请各位读者根据自身情况设置合理的遍历方法。

我们运行一下,看看遍历后的效果如何:

第一条评论中很明显的能看出,买家反应了物流快、价格便宜等信息,所以我们对物流正面、性价比正面加了一分。

第二条中买家提到了好喝,那么就是口感方面的正面评价,也对其加一分。

第十条提到了商品ip属性和口感方面,也追加一分。

总的来说达到了我们想要的目的!虽然代码比较简陋但效果还不错!

6、 结果分析

首先我们将结果汇总在同一张表里

这样看来可能不够明显,我们用Tableau做个图看看:

我们可以看出,口感是用户比较关注的点,占了绝大部分的比例,相比于其他的日期、口味等等遥遥领先。

紧随其后的便是性价比、物流了。

不同类别 正负面评价 占比是怎么样的呢?

从整体来看,评论整体趋向于好评,其中口味(橘子、青瓜、白桃)这边没办法细分,口感、性价比、物流方面 正面评论占了绝对的主导。

那么正面评价主要来自于哪里呢?我们看看口感方面的正面评价:

初步筛选后,我们可以看到,一共给出了194口感的正面评价,可以说这个气泡水的口味是相当的赞了!那么其中白桃口味占到的比例更高,最奇怪的是没有人提到青瓜口味(说实话我挺爱喝这个青瓜口味的,比较爽口),可能是我们本次取到的样本数不足的原因。

在性价比方面:

正面评论一共提到62次,可以看出元气森林的气泡水从口味、口感、包括所宣传的0卡、低热量等方面都做的很不错,价格也比较亲民。可能因为本次分析所采集到的数据不够全面导致部分方向与实际有些偏差,但我们也大胆的进行分析,给出性价比负面评价的买家很可能是对价格不够满意,在市面上为5-6元一瓶,部分买家可能也会有所顾忌,但鉴于大家对口感方面有99%的好评率,我们可以通过进行打折促销活动,或者多买多送等活动来吸引这部分对价格敏感的消费者。

结语

在最后,我们展示一下部分买家的对白桃口味汽水的评价吧(这个口味是大家最喜欢的口味哦!)

至此,我们本次分析就告一段落了,我们采用了最简单浅显的方式对获取到的评论进行了拆分,并将拆分后的字符串进行了分析、量化、可视化等操作,距离接触到真正的数据分析又近了一步~

  • 13
    点赞
  • 85
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值