生成开端原著小说词云
今天刚好看了开端,然后又学了一点Python,于是灵光一闪,想到用新学的wordcloud生成一下小说的词云会怎么样。
代码如下
import jieba
import wordcloud
f = open("开端.txt", "r", encoding="utf-8")
t = f.read()#一次性读入
f.close()
ls = jieba.lcut(t)#返回分词结果,一个列表
newls=[]#建一个新列表
for word in ls:
if len(word)>1:
newls.append(word)#新列表去掉了单个字
txt = " ".join(newls)#用空格把列表里的元素连成长字符串
w = wordcloud.WordCloud(width = 1000, height = 700,background_color = "white",font_path = "/System/Library/Fonts/Supplemental/Songti.ttc")#中文词云得指定一下字体别忘了
w.generate(txt)#加载文本
w.to_file("开端词云.png")
结果如下
女主的姓没了,笑死,可能是分词分出去了给砍掉了。
没有去掉一些“什么”“这样”“已经”之类的虚词,看起来有点奇怪,不过无所谓了。第一次用Python玩自己想玩的小玩意,也挺开心。
开端看到第10集了,下周接着看,希望能看到一个完美的结局!