jieba库
一、安装
进入命令行(win+R之后输入cmd,回车即可)
输入:pip install jieba
然而每次安装似乎总会发生错误,这次也不例外,提示响应时间过长
有大神提示需要更改路径到python安装目录下的Scripts文件夹下(之前的文章里有写更改命令哦)
改好后,输入pip install jieba,安装成功!
二、使用
1.三种模式:精确模式(将词语精确切开)、全模式(将所有可能的词语切开)、搜索引擎模式(对精确切开后的词语再次切分)
2.jieba.lcut(s)——精确模式切分,返回列表类型
jieba.lcut(s,cut_all=True)——全模式切分,返回列表类型
jieba.lcut_for_search(s)——搜索引擎模式切分,返回列表类型
jieba.add_word(w)——向分词词典添加新的词语
Wordcloud库
一、安装
在cmd命令行输入:pip install wordcloud
等待下载完成即可
二、使用
w = wordcloud.WordCloud()代表一个文本对应的词云
w.generate(txt)——向w中加载文本txt
w.to_file(name)——将词云输出为.png或.jpg
三步走: 1.配置对象参数:
默认width=200,height=400,min_font_size=4最小字号,max_font_size最大字号,
font_step=1 ,font_path="xxx.ttc"默认为None ,max_words最大单词数量,
stop_words排除词列表,mask指定词云形状(需要配合imread()使用),background_color="white"背景颜色
2.加载词云文本
3.输出词云文件
例子:
(一)
import wordcloud
c = wordcloud.WordCloud()
c.generate("wordcloud by Python")
c.to_file("wordcloud.png")
(二)
import jieba
import wordcloud
txt = "大家好,欢迎大家来我的博客一起讨论关于Pyhon学习的有效方法哦!"
w = wordcloud.WordCloud(width=1000,font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("bluewn.jpg")
若是遇见错误No module named 'matplotlib':
那就在cmd输入pip install matplotlib 安装吧!
等待安装结束即可