今天下午解决了之前学习python的一个问题。即python词云在windows 10下会与内置函数random库发生冲突。
报错:
我简单地把它理解成变量冲突。
尝试了许多方法没有结果以后,我转向Linux系统进行词云生成。
解决的三个问题:
1、使用"PSFTP"在Windows与Linux传递文件
cd 即更换Linux系统目录
lcd 即更换Windows系统目录
put 将文件从本地上传至服务器
get 将文件从服务器下载到本地
2、在Linux下安装微软雅黑字体"msyh.tcc"
#! Linux系统字体路径
cd /usr/share/fonts/lyx/
#!查询是否存在中文字体
fc-list lang=zh
注:微软雅黑字体路径在C盘,有粗细正常三个tcc文件
3、生成词云
材料:庆祝改革开放40周年大会文字实录.txt
Code
import wordcloud
import jieba
import matplotlib
# 加载文件,处理字符串
ffff = open("gaigekaifang.txt", "r", encoding="utf-8")
#f = open("D:\\001文件\\pystudyprogram\\gaigekaifang.txt","r")
tttt = ffff.read()
ffff.close()
for ch in "'\n'' '!?。。"#$%&'()*+,-/:;<=>@[\]^_`{|>}~⦅⦆「」、、〃》「」『』【】〔〕〖〗〘〙〚〛〜〝〞〟〰〾〿–—‘’‛“”„‟…‧﹏.":
tttt = tttt.replace(ch,"")
# 生成词云
ls = jieba.lcut(tttt)
txt = " ".join(ls)
cccc = wordcloud.WordCloud(font_path = "msyh.ttc", width = 1000, height = 700, background_color = "white")
cccc.generate(txt)
cccc.to_file("ciyun02.png")
update 2018/12/18 17:32