电动牙刷电商评论分类方法(R语言)

该篇文章通过数据分析电动牙刷的用户评论,关注了外观、清洁效果、便携性、噪音振动、智能功能以及操控难易度等方面。结果显示电池续航和噪音振动方面的五星好评比例相对较低。作者使用R语言中的`CrossTable`函数对评价星级和各项特性进行了交叉表分析。
摘要由CSDN通过智能技术生成

电动牙刷评论主要涉及外观、清洁力度、便携性、噪音振动、智能、操控难度等,分类方法详见下方R代码。结合爬虫得到的评价星级,可了解各类评论的占比差异,如下图可知电池续航、噪音振动的五星好评比例低于其它角度(83%和78%)。

library(tidyr)
library(gmodels)

data<-read.csv("电动牙刷评论20230325.csv")
data<-data[!is.na(data$评价内容),]
data<-data[!duplicated(data$评价内容),]  #去重
data1<-separate_rows(data,评价内容,sep = "\n") #评论文本分段


data1$外观<-grepl('颜色|外观|外形|外表|美观|美丽|简洁|
               大方|体积|颜值|漂亮|好看|工艺',data1$评价内容)
CrossTable(data1$评价星级,data1$外观,prop.r = F,prop.t=F,
           prop.chisq=F,format = "SPSS",chisq = T)

data1$清洁<-grepl('清洁|干净',data1$评价内容)
CrossTable(data1$评价星级,data1$清洁,prop.r = F,prop.t=F,
           prop.chisq=F,format = "SPSS",chisq = T)

data1$续航<-grepl('续航|电池|充电|电力|没电',data1$评价内容)
CrossTable(data1$评价星级,data1$续航,prop.r = F,prop.t=F,
           prop.chisq=F,format = "SPSS")

data1$携带<-grepl('便携|携带|外出|出差',data1$评价内容)
CrossTable(data1$评价星级,data1$携带,prop.r = F,prop.t=F,
           prop.chisq=F,format = "SPSS")

data1$噪音振动<-grepl('噪音|振动|震动|音量|声音|震',data1$评价内容)
CrossTable(data1$评价星级,data1$噪音振动,prop.r = F,prop.t=F,
           prop.chisq=F,format = "SPSS")

data1$智能<-grepl('压感|智能|得分|APP|App|app|算法|数据|分数',data1$评价内容)
CrossTable(data1$评价星级,data1$智能,prop.r = F,prop.t=F,
           prop.chisq=F,format = "SPSS")

data1$操控<-grepl('操控|控制|掌握|把握',data1$评价内容)
CrossTable(data1$评价星级,data1$操控,prop.r = F,prop.t=F,
           prop.chisq=F,format = "SPSS",chisq = T)

#其它内容
data1$无线充电<-grepl('无线|接触式',data1$评价内容)
data1$彩屏<-grepl('彩屏|屏幕|显示屏',data1$评价内容)
data1$消毒<-grepl('消毒|杀菌',data1$评价内容)
data1$防水<-grepl('防水|漏水|渗水',data1$评价内容)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值