python和苹果_苹果手机评论情感分析(附python源码和评论数据)

该博客介绍了如何使用Python进行苹果手机评论的情感分析。通过抓取网页评论数据,利用词典(停用词、否定词、程度副词、情感词)进行预处理,结合jieba分词,计算评论得分。然后,利用word2vec进行词向量表示,并通过PCA降维和SVM分类,得出情感分析结果。最后,对比了基于词典和word2vec方法的准确度。
摘要由CSDN通过智能技术生成

原标题:苹果手机评论情感分析(附python源码和评论数据)

首先抓取网页上的数据,每一页十条评论,生成为一个txt文件。

数据链接

回复公众号 datadw 关键字“苹果”获取。

以下采用既有词典的方式:

准备四本词典,停用词,否定词,程度副词,情感词,链接也给出来:

回复公众号 datadw 关键字“苹果”获取。

[python]view plaincopy

f=open(r'C:/Users/user/Desktop/stopword.dic')#停止词

stopwords = f.readlines()

stopwords=[i.replace("n","").decode("utf-8")foriinstopwords]

fromcollectionsimportdefaultdict

# (1) 情感词

f1 =open(r"C:UsersuserDesktopBosonNLP_sentiment_score.txt")

senList = f1.readlines()

senDict = defaultdict()

forsinsenList:

s=s.decode("utf-8").replace("n","")

senDict[s.split(' ')[0]] = float(s.split(' ')[1])

# (2) 否定词

f2=open(r"C:UsersuserDesktopnotDict.txt")

notList = f2.readlines()

notList=[x.decode("utf-8").replace("n","")forxinnotListifx !='']

# (3) 程度副词

f3=open(r"C:UsersuserDesktopdegreeDict.txt")

degreeList = f3.readlines()

degreeDict = defaultdict()

fordindegreeList:

d=d.decode("utf-8")

degreeDict[d.split(',')[0]] = float(d.split(',')[1])

导入数据并且分词

[python]view plaincopy

importjieba

defsent2word(sentence):

"""

Segment a sentence to words

Delete stopwords

"""

segList = jieba.cut(sentence)

segResult = []

forwinsegList:

segResult.append(w)

newSent = []

forwordinsegResult:

ifwordinstopwords:

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值