在数据文件 lizhi.txt 里有一堆励志短语,每句一行。示例如下:
1.努力的最大意义,是让自己随时有能力跳出自己厌恶的圈子。
2.埋怨只是一种懦弱的表现;努力,才是人生的态度。不安于现状,不甘于平庸,就可能在勇于进取的奋斗中奏响人生壮美的乐章。
3.最好的时光,在路上;最好的生活,在别处。独自上路去看看这个世界,你终将与最好的自己相遇。
…
用 jieba 分词库的 lcut() 函数分词,统计分词后的长度大于等于 2 的词组的出现次数,按照出现次数排序,在屏幕上显示出现次数最多的 10 个词。
在画布上,用 tutle 的 circle 画填充为红色的圆圈,圆圈的半径为出现次数 n*4,最大的圆圈的起点在画布的坐标 (-300,0),其余的圆按顺序沿着 x 轴向右边相邻,连续扩展。
画出来的图示例效果如下:
![在这里插入图片描述](https://img-blog.csdnimg.cn/fd0aac520fa84e6b89c238c392e2d937.png
示例1:
输出: "
自己 16
为了 7
曾经 7
努力 6
人生 5
"
import jieba
import turtle as t
def drawCircle(x,y,radius,color,name):
t.pencolor(color)
t.penup()
t.goto(x, y)
t.write(name, font=('Arial', 10, 'normal')) #在当前的(x,y),写上name内容,文字属性由font决定。font三元组括号中分别指的是:字体、字号、样式,normal表示常规样式,还可设置为粗体、斜体、粗斜体。
t.seth(-90) #将绘图方向设置为-90度方向
t.pendown()
t.circle(radius)
return t.pos() #t.pos()返回海龟当前的位置,例如:(-300.00,0.00)
dws = {}
with open('lizhi.txt', 'r',encoding="utf-8") as f:
for l in f.readlines():
ws = jieba.lcut(l)
for w in ws:
if len(w) >= 2:
dws[w] = dws.get(w,0) + 1
dls = list(dws.items())
dls.sort(key = lambda x:x[1], reverse= True)
x,y = -300,0
for i in range(10):
print(dls[i][0],dls[i][1]) #输出结果
x,y = drawCircle(x,y,dls[i][1]*4 ,'red',dls[i][0]+str(dls[i][1]))
x += dls[i][1] * 8 #改变x初始位置,y值不变
t.done() #程序运行之后,程序不会退出,需要手工关闭窗口退出