python画的新闻联播热词云图

在kaggle上看到一个感兴趣的数据集,学习了其中一个kernel,然后根据自己目前的实际情况改写了做云图的部分代码,分享到这里,希望能帮助到看到这篇博客的朋友,感谢大神的无私奉献。。

kaggle链接

有兴趣的朋友可以进去看看,不多说了,下面开始:

这部分代码用到的python三方库包括:numpy pandas matplotlib wordcount jieba pillow

如果你的电脑安装了pip,那安装这些库将不是什么难事:

pip install numpy

pip install pandas

pip install matplotlib

pip install wordcount

pip install jieba

pip install pillow

如果没有pip,建议你安装一个(建议是直接安装anaconda,而不是直接装python)

准备就绪后,以下是具体代码:

import numpy as np
import pandas as pd
import matplotlib.font_manager as fm
import matplotlib.pyplot as plt
from wordcloud import WordCloud
import jieba
from PIL import Image


# 'date','tag','headline','content'
file_name = 'data/chinese_news.csv'
text = pd.read_csv(file_name, usecols=['tag', 'headline', 'content'])
result = ""
for headline in text['headline']:
    str_headline = ' '.join(jieba.cut(headline))
    result += str_headline
# 字体格式,到github下载压缩包解压即可使用
# 地址:https://github.com/adobe-fonts/source-han-sans/raw/release/SubsetOTF/SourceHanSansCN.zip
font_path = "SourceHanSansCN/SourceHanSansCN-Light.otf"
prop = fm.FontProperties(fname=font_path)
# 用[0:320, 156:484, :]切割和选择图片的尺寸和显示颜色,imgs/mask.jpg为一张图片,这里用了一张京哥的
mask = np.array(Image.open("imgs/mask.jpg"))[0:320, 156:484, :]
wc = WordCloud(
    font_path=font_path,
    mask=mask
)
wc.generate(result)
plt.figure()
plt.imshow(wc)
# alpha为透明度,取值范围:0-1
plt.imshow(mask, alpha=0.5)
plt.axis('off')
plt.show()

运行结果:

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

柏舟飞流

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值