今日主讲二维数据和运用wordcloud库绘制词云
CSV(Comma-Separated Valus)国际通用的一二维数据存储格式,一般.csv扩展名,每行一个一维数据,采用逗号分隔,无空行,Excel和一般编辑软件都可以读入或另存为.csv文件,如果某个元素缺失,逗号仍要保留,二维数据的表头可以作为数据存储,也可以另行存储,逗号为英文半角逗号,逗号与数据之间无额外空格.
从CSV格式的文件中读入文件
fo = open( fname )
ls =[]
for line in fo:
line = line. replace("\n","")
1s. append(line. sp1it(","))
fo. close( )
将数据写入CSV格式的文件
1s = [[], [], []] #二维列表
f = open(fname, 'w')#覆盖写
for item in ls:
f .write(',' .join(item) + ' \n')
f. close( )
运用wordcloud库绘制词云
wordcloud.WordCloud()代表一个文本对应的词云,可以根据文本中词语出现的频率等参数绘制词云,词云的绘制形状,尺寸和颜色都可以设定
import jieba
import wordcloud
txt = "程序设计语言是计算机能够理解和\
识别用户操作意图的一-种交互体系,它按照\
特定规则组织计算机指令,使计算机能够自\
动进行各种运算处理。"
w = wordcloud.WordCloud(width=1000,\
font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("C:/Users/86151/Desktop/pywcloud.png" )
工作报告词云
可以自己选择一篇文章作为文本,并且加上图形,因为wordcloud默认为矩形,相关代码上面表中都有说明
import jieba
import wordcloud
from imageio import imread
mask=imread("C:/Users/86151/Desktop/图形.jpg")
f=open("C:/Users/86151/Desktop/文章.txt","r",encoding="utf-8")
t=f.read()
f.close
ls=jieba.lcut(t)
txt=" ".join(ls)
w=wordcloud.WordCloud( font_path="msyh.ttc",mask=mask,width=1000,\
height=700,background_color="white",max_font_size=100,\
min_font_size=10)
w.generate(txt)
w.to_file("C:/Users/86151/Desktop/词云.jpg")
有木有感觉很好看???