Kindle产品评论数据分析---基于excel的分析过程

目录

业务背景

一)明确分析目的

二)数据采集

三)数据清洗

四)数据分析与构建模型

1、相关产品的评论数排名和平均评分反映的问题

2、各评论占比,推荐评论中好评占比

3、kindle相关产品随时间变化其评论数的变化情况

4、kindle相关产品的优点,对评论内容生成词云

五)总结与建议


业务背景

对于用户:在购买kindle产品时,查看Kindle产品的相关评论,做出决定;

对于企业:可以通过kindle评论,了解用户对kindle的真实体验,针对性改进产品。

一)明确分析目的

1、kindle相关产品的评论数和评分

2、kindle产品的好评和差评占比,推荐评论占比

3、kindle评论数随时间(年份/月份)变化情况

4、kindle产品的优缺点

5、kindle产品受好评的原因

6、结论与业务建议

二)数据采集

slsConsumer Reviews of Amazon Products | Kaggle

三)数据清洗

1、选择子集

1)隐藏与分析问题无关的列

2)选择需要的行

在categries列中进行数据-筛选-包含-"Kindle",进行数据筛选

2、重命名

将英文名重命名为中文名称

3、删除重复值

根据评论时间、评分、评论文本三列的内容判定是否重复,进行去重操作。

4、缺失值处理

筛选产品名、产品类别、评论时间、评分,将空值行删除

评论标题和评论内容可以为空值

5、一致化处理

1)将评论日期拆分为年、月、日三列

用LEFT函数提取年份

用MID和FIND函数提取月份

用MID和FIND函数提取日期

2)对评论分数进行分组(0--3分为差评,4--5分为好评)

IF(D2<=3,"差评",“好评”)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值