写在前面
如图所示,这个词云展示的内容出现了同一关键词重复的现象,这并不是我们想要的
问题解决
其实这种情况与collocations
参数有关,默认collocations=True
,会统计搭配词。比如你的text是“我爱码代码”,当collocations为True时,就会把“码代码”也当作一个词进行统计,所以会出现重复。所以添加collocations=False
即可。
from wordcloud import WordCloud
wc = WordCloud(
font_path=font,#使用的字体库
margin=2,
mask=mask,#背景图片
background_color='white', #背景颜色
max_font_size=200,
# min_font_size=1,
max_words=200,
scale=5,
collocations=False
# stopwords=STOPWORDS, #屏蔽的内容
)