python jieba函数_Python jieba分词、词云、文件读取、函数调用、匿名函数

本文介绍了如何使用Python的jieba库进行中文分词,并结合wordcloud库生成词云。首先展示了基本的词云生成步骤,然后详细讲述了如何读取文件并进行分词,最后演示了如何绘制特定形状的词云以及对列表排序和使用匿名函数进行排序的方法。
摘要由CSDN通过智能技术生成

词云的生成

使用wordcloud 库生成词云

安装wordcloud

pip install wordcloud

调用wordcloud类,生成词云对象

词云格式:WordCloud().genrate.to_file()

from wordcloud import WordCloud

txt = """开头的水下长对决戏可算华语电影的顶尖存在;驱逐舰、导弹和坦克在商业片里这么狂用也是了得;镜头运用和笑点插入都很好莱坞爆米花,不功不过;从头打到尾是真拼,虽然镜头也有略乱时;因为没啥期望值,所以被吴京的野心吓了一跳;吴刚、于谦和丁海峰老三位像炖烂熟的牛筋,嚼着就舒服。"""

wc = WordCloud(

background_color='white',

font_path='msyh.ttc',

width=800,

height=600).generate(txt)

wc.to_file('ccc.png')

ccc

使用结巴分词对中文词进行分割

import jieba

text = """开头的水下长对决戏可算华语电影的顶尖存在;驱逐舰、导弹和坦克在商业片里这么狂用也是了得;镜头运用和笑点插入都很好莱坞爆米花,不功不过;从头打到尾是真拼,虽然镜头也有略乱时;因为没啥期望值,所以被吴京的野心吓了一跳;吴刚、于谦和丁海峰老三位像炖烂熟的牛筋,嚼着就舒服。"""

#中文分词处理

txt_list = jieba.lcut(text)

#将列表转化成字符串,用空格隔开

txt = " ".join(txt_list)

#调用wordcloud类,生成词云对象

from wordcloud import WordCloud

#txt = """开头的水下长对决戏可算华语电影的顶尖存在;驱逐舰、导弹和坦克在商业片里这么狂用也是了得;镜头运用和笑点插入都

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值