某家具店差评数据分析

本文分析了一家家具店的差评数据,关注商品三级分类、问题描述和计数。数据预处理后,通过商品数量排序发现凳子和衣帽架售后问题突出。数据可视化显示凳子在特定时间段售后增多,可能与销量有关。文本分析揭示主要问题涉及螺丝、质量、安装。建议结合业务深入研究以改进产品。
摘要由CSDN通过智能技术生成

某家具店差评售后数据分析

近日得到了一份某家具店的差评数据,本着锻炼自己的数据分析实战能力,我分析该数据集,下面是分析内容和步骤。
由于该数据集是内部数据,故不展示具体数据。

1.数据预处理和基本思路

该数据集是一份excel文件,通过pandas中info,head,describe等函数查看可发现,该数据集结构化完整,无缺失数据。不愧是一份宝贝啊。
检查数据的整体结构和大致内容发现。该数据集值得关注的维度为三级分类,客户问题描述和计数。
具体是什么意思呢。三级分类指商品类别,如桌子,椅子,凳子等。客户问题描述是一段可变长的字符串,内容为客户对商品问题的描述和退换货的理由,计数则是订单数量。

通过对以上维度的了解,我想到这样一些基本的分析思路。
1.出现问题的商品数量排序
分析哪些家具的差评和售后问题最多。当然要明确的一点是不同商品的销量不同,所以这个数据并不一定准确反映商品的实际情况。
2.商品问题描述的文本分析
通过文本分析判断具体是哪些方面的问题最多,从而针对性的改善,减少差评,提升用户体验。

df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 17827 entries, 0 to 17826
Data columns (total 13 columns):
SKU编码          17827 non-null int64
品牌名称           17827 non-null object
三级分类           17827 non-null object
销售姓名           17827 non-null object
服务单号           17827 non-null int64
订单编号           17827 non-null int64
售后服务单申请时间_日    17827 non-null datetime64[ns]
客户问题描述         17805 non-null object
申请一级类型描述       17768 non-null object
是否通过           17827 non-null object
主供应商名称         17827 non-null object
用户pin          17808 non-null object
服务单号_去重计数      17827 non-null int64
dtypes: datetime64[ns](1), int64(4), object(8)
memory usage: 1.8+ MB
df.head()

2.数据可视化和数据分析

针对提出的想法的思路,进行具体的代码实操

2.1商品分类及数量统计

一行代码实现分类及数量统计

df2 = df.groupby('三级分类')['服务单号_去重计数'].sum().reset_index(<
  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值