电商评论情感分析

(1)评论集合抽取,给出抽取代码,抽取结果

#评论抽取

  • pinglun<-as.data.frame(read.csv("D:/dui/huizong.csv"))#读入数据
  • pinglun1<-which(pinglun$品牌=="海尔")#查看品牌为海尔的数据
  • pinglun<-pinglun[pinglun1,]#用海尔数据替换原始pinglun的数据
  • pinglun2<-pinglun[39001:40000,]#提取pinglun中39001到40000的数据
  • pinglun2$评论

 

  • summary(pinglun2)

 

(2)评论预处理,给出代码及结果(文本去重,去空,去无意义符号如“......”,“???”,去字符“AABBBCHD”等

#数据预处理

  • summary(pinglun2)

#文本去重

  • duplicated(pinglun2$评论)#查看重复值
  • sum(duplicated(pinglun2$评论))#查看重复值有多少

 

  • pinglun2<-pinglun2[!duplicated(pinglun2$评论),]#删除重复值

#删除缺失值

  • is.na(pinglun2$评论)#判断缺失值
  • sum(is.na(pinglun2$评论))#统计缺失值有多少,无缺失值

  • 1
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值