Python进行vivo手机评论数据信息情感分析、LDA主题分析

该博客使用Python对vivo手机京东评论进行情感分析和LDA主题挖掘,发现vivo手机的优势在于运行流畅、速度快、拍照效果好、性价比高,但存在问题如客服、充电和电池问题。建议vivo改进充电电池质量和提升客服服务质量。
摘要由CSDN通过智能技术生成

一、摘要

用Python对爬取得到的京东vivo手机评论信息数据进行情感分析,通过LDA模型进一步分析,进而总结出vivo手机的优势与劣势。

二、分析步骤

1)重复值处理
2)过滤短句
3)情感分析
4)去除无用符号
5)分词
6)词频统计
7)LDA主题分析
8)结论

三、具体分析过程

1.导入数据

import pandas as pd

data = pd.read_csv('vivo_comments.csv')
print(type(data))

2.重复值处理
将读取数据中所有列相同的值删除

data_null = data.drop_duplicates()
print(data_null)
data_null.to_csv('comments_null.csv')
data_null_comments = data_null['contents']
data_null_comments.to_csv('contents.txt',index=False,encoding='utf-8')
print(len(data_null_comments))

3.过滤短句
将数据中长度小于4的过滤掉,保留长度大于4的数据。

data_len = data_null_comments[data_null_comments.str.len()>4]
print(data_len)
data_len.to_csv('contents.txt',index=False,encoding='utf-8')

4.情感分析
利用SnowNlP库将评论数据分为正面评论和负面评论

from snownlp import SnowNLP

data = pd.read_csv('contents.txt',encoding='utf-8',header=None)
print(data)
# print(type(data))
coms =
评论 20
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值