一.分析目标
Amazon是网络上最早开始经营电子商务的公司之一,是全球电商行业的佼佼者。而人们在电商平台进行购物时,会根据评论数量以及好评和坏评作为判断依据来购买商品。故本文采取亚马逊智能产品评论作为分析对象,获取有用信息,针对该分析对象提供可行性建议。
二.数据收集
1.数据来源
数据源来自kaggle,点击此处为下载地址,取自亚马逊智能产品2010.7-2018.4间的评论,总共34657条数据
2.分析指标
id 产品id
name 产品名称
asins 产品编号
reviews.date 评论时间
reviews.dateAdded 追加评论时间
reviews.doRecommend 评论是否被推荐
reviews.numHelpful 帮助性分数
reviews.rating 评分
reviews.text 评论内容
reviews.title 评论标题
三.数据处理
1.选取指标
为了方便分析,对指标进行了重命名:
df=pd.read_csv("Amazon_review.csv")
df=df[['id','asins','reviews.date','reviews.doRecommend','reviews.numHelpful','reviews.rating','reviews.text','reviews.title']]
columns={
'id':'产品Id','asins':'产品编号','reviews.date':'评论时间','reviews.doRecommend':'评论是否被推荐',\
'reviews.numHelpful':'帮助性分数','reviews.rating':'评分',