Jieba库与wordcloud库的学习汇总

最新推荐文章于 2024-05-15 09:00:00 发布

阿尔卑斯山上的积雪

最新推荐文章于 2024-05-15 09:00:00 发布

阅读量537

点赞数

分类专栏： python学习文章标签： jieba库和wordcloud库的学习汇总

本文链接：https://blog.csdn.net/qq_43691221/article/details/98872355

版权

6 篇文章 0 订阅

订阅专栏

学习了python之后想把python的一些知识再汇总一遍

函数	描述
jieba.lcut()	精确模式，返回一个列表类型的分词结果；jieba.lcut(“中国是一个伟大的国家” ) -> [‘中国’，‘是’，‘一个’，‘伟大’，‘的’，‘国家’]
jieba.lcut(s,cut_all=True)	全模式，返回一个列表类型的分词结果，存在冗余；jieba.lcut(“中国是一个伟大的国家” ,cut_all=True) -> [‘中国’，’'国事‘，‘一个’，‘伟大’，‘的’，‘国家’]
jieba.lcut_for_search(s)	搜索引擎模式，返回一个列表类型的分词结果，存在冗余；jieba.lcut_for_search(“中华人民共和国是一个伟大的国家”) -> [‘中华’，’'华人‘，‘人民’，‘共和’，‘共和国’，‘中华人民共和国’，‘是’，‘伟大’，‘的’]
jieba.add_word(w)	向分词词典增加新词w ; jieba.add_word(“蟒蛇语言”)

w = wordcloud.WordCloud()

方法	描述
w.generate(txt)	向WordCloud对象w中加载文本txt；w.generate(“Python and WordCloud”)
w.to_file(filename())	将词云输出为图像文件，.png或.jpg格式；w.tp_file(“outfile,png”)

w = wordcloud.WordCloud(<参数>)

参数	描述
width	指定词云对象生成图片的宽度，默认400像素；w = wordcloud.WordCloud(width=600)
feight	指定词云对象生成图片的高度，默认200像素；w = wordcloud.WordCloud(height=600)
min_font_size	指定词云中的最小字号，默认4号；w=wordcloud.WordCloud(min_font_size=10)
max_font_size	指定词云中的最大字号，根据高度自动调节；w=wordcloud.WordCloud(max_font_size=20)
font_step	指定词云中的字体字号的步进间隔，默认为1；w=wordcloud.WordCloud(font_step=2)
font_path	指定文件的路径，默认None；w=wordcloud.WordCloud(font_path=“msyh.ttc”)
max_words	指定词云现实的最大单词数量，默认200；w=wordcloud.WordCloud(max_words=20)
stop_words	指定词云的排除词列表，即不显示的单词列表；w=wordcloud.WordCloud(stop_words={“Python”})
mask	指定词云形状，默认为长方形，需要用imread()函数；from scipy.misc import imread /nmk = imread(“pic.png”) /n w=wordcloud.WordCloud(mask=mk)
background_color	指定词云图片的背景颜色，默认为黑色；w=wordcloud.WordCloud(background_color=“white”)

关注