使用的词云库
- jieba中文分词库
- wordcloud词云库
核心代码
1. 正则表达式
方法 | 函数 | 备注 |
---|---|---|
re.compile(pattern) | 编译 | |
re.sub(repl, string) | 替换 | repl:编译对象,string:文本 |
2. 标准库
多维数组转换为一维数组
from itertools import chain
list_2d = [[1,2,3],[3,4,5]]
list_1d = list(chain.from_iterable(li_2d))
print(list_1d)
3. 词云库
WordCloud
font_path: 字体路径,width 图片宽度,height 图片高度,max_words 最大词语数 ,background_color 背景颜色(其他参数自行搜索)
wc = WordCloud(font_path=r"C:/Windows/Fonts/SimHei.ttf", width=800, height=600, max_words=50,
background_color="white")
# 根据词频制作词云图,可以减少重复词
# c: 是一个字典
img = wc.generate_from_frequencies(c)
plt.figure(figsize=