近期,学校对呼和浩特市第二中学学生特质进行了调查,具体题目为“用关键词描述一下二中学生的特质(尽量在20字以内)".
为了更好的展示调查结果,我们基于Python的jieba库和wordcloud库进行了数据可视化统计分析。
第一步:统计词频
import jieba
import wordcloud
import matplotlib.pyplot as plt
w=wordcloud.WordCloud()
d=("C:\\Users\\Administrator\\Desktop\\a.txt")
f=open(d,"r")
# 生成对象
a=list(jieba.cut(f.read()))
c={}
for w in a:
if len(w)==1:
continue
else:
c[w]=c.get(w,0)+1
it=list(c.items())
it.sort( key=lambda x:x[1], reverse=True)
for i in range(30):
print(it[i][0],it[i][1])
具体结果如下:
第二步:生成云图
import jieba
import wordcloud
import matplotlib.pyplot as plt
w=wordcloud.WordCloud()
d=("C:\\Users\\Administrator\\Desktop\\a.txt")
f=open(d,"r")
ff=jieba.cut(f.read())
cc="".join(ff)
wc=w.generate(cc)
w.to_file("pywordcloud.png")
plt.figure(dpi=1000) #通过这里可以放大或缩小
plt.imshow(wc, interpolation='catrom',vmax=1000)
plt.axis("off") #隐藏坐标
生成结果如下: