统计两会政府工作报告热词频率,并生成词云

from wordcloud import WordCloud, ImageColorGenerator
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt

# 加载中国地图轮廓图
mask_image_path = r"D:\中国地图.png"
mask_image = Image.open(mask_image_path).convert('L')  # 转换为灰度图像
mask = np.array(mask_image)

# 从指定文件路径读取文本数据
text_file_path = r"D:\政府工作报告.txt"
with open(text_file_path, 'r', encoding='utf-8') as file:
    text = file.read()

# 设置字体路径以支持中文显示
font_path = 'simhei.ttf'  # 如果 simhei.ttf 不在当前目录,请提供完整路径

# 创建词云对象并生成词云
wordcloud = WordCloud(
    font_path=font_path,  # 设置支持中文的字体路径
    background_color="white",
    mask=mask,
    width=1600,
    height=800,
    max_words=200  # 设置最大词汇数为20
).generate(text)

# 显示词云图
plt.figure(figsize=(10, 5))
plt.imshow(wordcloud, interpolation="bilinear")
plt.axis("off")  # 关闭坐标轴
plt.show()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值