python知识快速补充6——jieba以及wordcloud使用

经过疯狂的刷课,这两天刷完了python的基础课程的五周,马上就可以进入到python数据处理课程了。在最后,我们使用jieba库和wordcloud库,生成一朵词云。
首先我们要在Anaconda中执行以下命令
pip install jieba
pip install wordcloud
配置两个包。

wordcloud 库的运用:

wordcloud库的运用主要就是三个函数,这三个函数也通俗易懂,其中最重要的函数是这个:w=wordcloud.WordCloud()
参数:
width,height;宽度,高度
min_font_size,max_font_size;最小字体,最大字体
font_step,font_path;步进间隔,字体路径
max_words,stop_words;词云显示最大单词数量,词云排除集合,数据类型为集合
mask;指定词云形状,为一张图片
background_color:背景颜色

其中,mask的使用如下:
mk=imread(“pic”)#这里是一张图片的路径
在参数中mask=mk即可。

jieba库的使用:

jieba库主要用于文本词语的切分,有以下三种模式:
精确模式:将文本精确的切开, 不存在冗余词汇
全模式:将文本所有可能的词语扫描出来,有冗余
搜索引擎:精确模式情况下再切分长词语
常用函数:
jieba.lcut("中国是一个伟大的国家") 精确模式
返回列表[‘中国’,‘是’,‘一个’,‘伟大’,‘的’,‘国家’]
jieba.lcut("中国是一个伟大的国家",cut_all=True)全模式
[‘中国’,‘国是’,‘一个’,‘伟大’,‘的’,‘国家’]
jieba.lcut_for_search(s)搜索引擎模式
jieba.add_world(w)向分词词典添加新词汇
其实这里面最常用的就是第一个了。。。。。

好了,我们来做一个词云试试看:

import jieba
import wordcloud 
f = open("D:\\wenben1.txt")
t=f.read()
f.close()
ls=jieba.lcut(t)#已经得到了词汇列表
txt=" ".join(ls)#词汇列表整合称为一个词语之间用空格分隔的字符串,因为w.generate()参数只能是由词汇和空格组成的字符串
w=wordcloud.WordCloud(font_path="msyh.ttc",width=800,height=500,
background_color="white",max_font_size=40)
#参数没有顺序,这里为了方便就写几个。
w.generate(txt)#生成词云
w.to_file("gvmt.png")#保存

效果如下:
在这里插入图片描述
这里方便起见,没有调用其他参数,大家可以自行调整。网上找了一张好看的图,激发一下学习的兴趣:
在这里插入图片描述
图片来源是这里:https://image.baidu.com/search/detail?ct=503316480&z=0&ipn=d&word=%E8%AF%8D%E4%BA%91&step_word=&hs=0&pn=1&spn=0&di=124520&pi=0&rn=1&tn=baiduimagedetail&is=0%2C0&istype=0&ie=utf-8&oe=utf-8&in=&cl=2&lm=-1&st=undefined&cs=3551847269%2C1676575473&os=1467432224%2C534072971&simid=3470652530%2C465394191&adpicid=0&lpn=0&ln=1363&fr=&fmq=1580822334090_R&fm=&ic=undefined&s=undefined&hd=undefined&latest=undefined&copyright=undefined&se=&sme=&tab=0&width=undefined&height=undefined&face=undefined&ist=&jit=&cg=&bdtype=0&oriquery=&objurl=http%3A%2F%2F5b0988e595225.cdn.sohucs.com%2Fimages%2F20180105%2Fd2c7deda9d3841e29c47768882889177.jpeg&fromurl=ippr_z2C%24qAzdH3FAzdH3Fojt4jtkw_z%26e3Bv54AzdH3Ff5AzdH3F4w62tgws%25E0%25lA%25b9%25Ec%25la%25bD%25Eb%25AF%25bD%25Ec%25BD%25Ad%25Ec%25BC%25bF_z%26e3Bip4s&gsm=&rpstart=0&rpnum=0&islist=&querylist=&force=undefined
好了,到这里为期三天的python基础知识突击课程就结束了,让我们进入数据处理的课程吧。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值