jieba分词统计

在数据文件 lizhi.txt 里有一堆励志短语,每句一行。示例如下:
1.努力的最大意义,是让自己随时有能力跳出自己厌恶的圈子。
2.埋怨只是一种懦弱的表现;努力,才是人生的态度。不安于现状,不甘于平庸,就可能在勇于进取的奋斗中奏响人生壮美的乐章。
3.最好的时光,在路上;最好的生活,在别处。独自上路去看看这个世界,你终将与最好的自己相遇。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬
…‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬
用 jieba 分词库的 lcut() 函数分词,统计分词后的长度大于等于 2 的词组的出现次数,按照出现次数排序,在屏幕上显示出现次数最多的 10 个词。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬
在画布上,用 tutle 的 circle 画填充为红色的圆圈,圆圈的半径为出现次数 n*4,最大的圆圈的起点在画布的坐标 (-300,0),其余的圆按顺序沿着 x 轴向右边相邻,连续扩展。‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬
画出来的图示例效果如下:
![在这里插入图片描述](https://img-blog.csdnimg.cn/fd0aac520fa84e6b89c238c392e2d937.png
示例1:
输出: "
自己 16
‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬为了 7
‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬曾经 7
‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬努力 6
‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬人生 5
‪‬‪‬‪‬‪‬‪‬‮‬‫‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬"
在这里插入图片描述

import jieba                                
import turtle as t                         

def drawCircle(x,y,radius,color,name):          
    t.pencolor(color)                           
    t.penup()                                    
    t.goto(x, y)                               
    t.write(name, font=('Arial', 10, 'normal')) #在当前的(x,y),写上name内容,文字属性由font决定。font三元组括号中分别指的是:字体、字号、样式,normal表示常规样式,还可设置为粗体、斜体、粗斜体。
    t.seth(-90)                                 #将绘图方向设置为-90度方向
    t.pendown()                                 
    t.circle(radius)                            
    return t.pos()                              #t.pos()返回海龟当前的位置,例如:(-300.00,0.00)

dws = {}                                          
with open('lizhi.txt', 'r',encoding="utf-8") as f: 
    for l in f.readlines():                        
        ws = jieba.lcut(l)             
        for w in ws: 
            if len(w) >= 2:                        
               dws[w] = dws.get(w,0) + 1           
dls = list(dws.items())                           
dls.sort(key = lambda x:x[1], reverse= True)        

x,y = -300,0                                         
for i in range(10):                                
    print(dls[i][0],dls[i][1])                      #输出结果
    x,y = drawCircle(x,y,dls[i][1]*4 ,'red',dls[i][0]+str(dls[i][1]))  
    x +=  dls[i][1] * 8                             #改变x初始位置,y值不变
t.done()                                            #程序运行之后,程序不会退出,需要手工关闭窗口退出
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值