从kaggle平台上下载了一份以前关于Kindle产品的消费者评论数据
提出问题
(1) Kindle相关产品的评论数排名和平均评分能反映哪些问题?
(2) Kindle相关产品的好评率如何?推荐评论占比怎样?
(3) Kindle相关产品随时间变化其评论数的变化情况是怎样的?
(4) Kindle相关产品备受好评的原因主要是什么?
数据来源:https://www.kaggle.com/datafiniti/consumer-reviews-of-amazon-products/home
数据集中有用的字段如下:
id-用户编号
name-产品名称
asins-产品编号,每一个产品编号对应一个产品,可用它进行产品分组
brand-品牌
categories-产品类别
keys-类别关键字
manufacturer-制造商
reviews.date-评论时间,可以分析各时间段评论数
reviews.dateAdded-追评时间
reviews.dateSeen-评论可见时间
reviews.doRecommend-评论是否被推荐
reviews.numHelpful-帮助性分子数
reviews.rating-评分,可进行求平均值等描述统计分析
reviews.sourceURLs-评论链接
reviews.text-评论文字内容,可以进行抽取关键字,分析评分原因
reviews.title-评论标题
reviews.username-用户名
数据清洗