词云小结(11_15软工评论分析)

1 整理文本格式

# -*- coding: utf-8 -*-
file="高德地图"
count=0
infile=open("d://"+file+".txt",'r',encoding='utf-8')
#content = infile.read().decode('utf-8')
data=[]
for line in infile:
    #print(line)
    if line[0]=='c':
        #print(line)
        if "无意中" in line:
            continue
        m=line[9:len(line)-2]
        #print(m)
        data.append(m)
        data.append('\n')
        count=count+1

infile.close()
print(data)

outfile=open("d://"+str(file)+"_new"+".txt",'w',encoding='utf-8')
for i in range(len(data)):
    outfile.write(data[i])
outfile.close()

2 词云

from wordcloud import WordCloud
import matplotlib.pyplot as plt

file="去哪儿旅行"
text=open("d://"+file+"_new.txt",encoding='utf-8').read()
font = "C:\Windows\Fonts\msyh.ttc"
wordcloud = WordCloud(background_color='white',width=5000, height=3000, margin=2,font_path=font).generate(text)
plt.figure(figsize=(16,8))
plt.imshow(wordcloud)
plt.axis('off')
plt.show()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值