【Python学习记录】爬虫笔记4——wordcloud的使用

5 篇文章 0 订阅
3 篇文章 0 订阅

利用wordcloud将爬取的文本信息绘制成指定轮廓的图片
先上代码
import matplotlib.pylab as plt

from wordcloud import WordCloud,ImageColorGenerator,STOPWORDS

import codecs #可以指定编码打开

from imageio import imread #将图片变成多维数组

from os import path

class Draw_cloud():
def init(self):
self.font_path ="./font/simhei.ttf" #设置字体的路径
self.image_path = “timg.jpg” #设置图片路径
self.jieba_result =“jieba_result.txt”

#把图片变成多维数组  然后用文字替换
def get_info(self):
    d =path.dirname(__file__) #获取当前文件的操作路径
    image =imread(self.image_path) #将图片变为多维数组 实现与文字的交互
    text =codecs.open(path.join(d,self.jieba_result),"rb",encoding="utf-8").read()#用二进制读取分词之后的评论信息
    self.draw_pic(image,text)

def draw_pic(self,image,text):
    stopwords =set(STOPWORDS) #使用默认的屏蔽词汇  一个集合
    wordcloud = WordCloud(font_path=self.font_path,mask=image,
                          stopwords=stopwords,background_color="white",max_words=2000,max_font_size=200
                          ).generate(text)   #(字体位置,图片数组,屏蔽字,背景色,最大次数,以及字体最大限制).二进制文字信息(使用二进制文字与图片交互)
    image_color = ImageColorGenerator(image)        #设置文字的颜色为背景图片颜色
    wordcloud.to_file("wordcloud.jpg") #给生成的词云命名
    plt.imshow(wordcloud.recolor(color_func=image_color))#指定生成词云颜色
    plt.axis("off")  #不显示坐标轴
    plt.show()

Fun =Draw_cloud()
Fun.get_info()
处理结果和所用的背景图如下

在这里插入图片描述
在这里插入图片描述
本篇主要是为了保存代码,没有深入研究wordcloud的使用,只是初步了解其用途,待深入了解后做个补充。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值