小白学习之路-词云分析

本文介绍了作者使用Python进行词云分析的过程,涉及jieba、wordcloud、numpy、pandas和matplotlib等库。通过对手机评论数据的处理,发现了评论中影响手机评价的主要因素,包括屏幕、系统、物流、电池和性价比。
摘要由CSDN通过智能技术生成

前言

本文为小丫用python尝试探索影响手机评论的因素,使用的python库有jieba、wordcloud、numpy、pandas、matplotlib。此外还需要导入stopwords中文库,这个网上有很多分享的。

数据背景

本次使用的数据为清洗后的csv文件,数据分为评论得分和评论内容两列,但是由于用excel反复打开,兼容问题导致最后数据合并为一列了,所以后面代码就基本合并后的数据进行的。

1.读取数据
line = pd.read_csv('C:./mobilephone_c.csv',usecols=[0])
stopwords = pd.read_csv('C:./stopwords12.csv',usecols=[0])
2.剔除stopword以及构建关键词-评论分数 的dataframe
def creat_key_words_and_score_dataframe(line,stopwords):	 
    comment_score = []
    key_words=[]
    for index, row in line.iterrows():
    	for comment_line in row:
    	    score= comment_line[0]
    	    comment_cut = jieba.lcut(comment_line[2:])   #jieba分词器进行分词
    	    for key_word in comment_cut:
    	        if key_word not in stopwords.stopword.values and
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值