目录
业务背景
对于用户:在购买kindle产品时,查看Kindle产品的相关评论,做出决定;
对于企业:可以通过kindle评论,了解用户对kindle的真实体验,针对性改进产品。
一)明确分析目的
1、kindle相关产品的评论数和评分
2、kindle产品的好评和差评占比,推荐评论占比
3、kindle评论数随时间(年份/月份)变化情况
4、kindle产品的优缺点
5、kindle产品受好评的原因
6、结论与业务建议
二)数据采集
slsConsumer Reviews of Amazon Products | Kaggle
三)数据清洗
1、选择子集
1)隐藏与分析问题无关的列
2)选择需要的行
在categries列中进行数据-筛选-包含-"Kindle",进行数据筛选
2、重命名
将英文名重命名为中文名称
3、删除重复值
根据评论时间、评分、评论文本三列的内容判定是否重复,进行去重操作。
4、缺失值处理
筛选产品名、产品类别、评论时间、评分,将空值行删除
评论标题和评论内容可以为空值
5、一致化处理
1)将评论日期拆分为年、月、日三列
用LEFT函数提取年份
用MID和FIND函数提取月份
用MID和FIND函数提取日期
2)对评论分数进行分组(0--3分为差评,4--5分为好评)
IF(D2<=3,"差评",“好评”)