项目场景:
提示:这里简述项目相关背景:
使用dendrogram画层次聚类树的时候报没有字体错:RuntimeWarning: Glyph 38142 missing from current font.
加入两行代码解决:
plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文标签
plt.rcParams['axes.unicode_minus'] = False
# 可视化
from matplotlib import pyplot as plt
plt.figure(figsize=(30, 100))
plt.rcParams['font.sans-serif'] = ['SimHei'] # 显示中文标签
plt.rcParams['axes.unicode_minus'] = False
plt.title('微博文本层次聚类树状图')
plt.xlabel('微博文本')
plt.ylabel('距离')
dendrogram(
linkage_matrix, # (n-1)*4的矩阵
labels=all_texts, # 所有文章
leaf_rotation=-90
)
plt.show()
plt.close()