WordCloud学习

WordCloud学习

class参数

  1. font_path:string

    使用otf或ttf字体,linux系统上默认是DroidSansMono字体,其他OS请调整。

  2. width:int (default=400)

    词云画布宽度。

  3. height:int (default=200)

    词云画布高度。

  4. prefer_horizontal:float (default=0.90)

    水平拟合。

  5. mask:nd-array or None (default=None)

    使用掩码图片。

    import numpy
    alice_mask = numpy.array(Image.open(path.join(d, "alice_mask.png")))
    
  6. contour_width: float (default=0)

    掩码图片轮廓宽度。

  7. contour_color: color value (default=“black”)

    掩码轮廓颜色。

  8. scale:float (default=1)

    绘制大型词云可以使用高比例。

  9. min_font_size:int (default=4)

    最小字体尺寸。

  10. max_font_size:int or None (default=None)

    最大字体尺寸。

  11. max_words:number (default=200)

    词云中包含的最大单词数量。

  12. font_step:int (default=1)

  13. stopwords:set of strings or None

    停用词。没有将使用内置的。使用generate_from_frequencies方法将忽略。

  14. background_color:color value (default=“black”)

  15. mode:string (default=“RGB”)

  16. relative_scaling:float (default=‘auto’) ×××

  17. color_func:callable, default=None ×××

  18. regexp:string or None (optional) ×××

  19. collocations:bool, default=True

    是否包含两个单词组成的词组。

  20. colormap:string or matplotlib colormap, default=“viridis”

    Matplotlib colormap从每个单词中随机绘制颜色。如果指定了“color_func”,则忽略。

  21. normalize_plurals:bool, default=True

  22. repeat:bool, default=False

方法

  1. fit_words(frequencies)[source]

    方法generate_from_frequencies的别名。

    返回值为WordCloud对象。

  2. generate(text)[source]

    方法generate_from_text的别名。

    返回值为WordCloud对象。

  3. generate_from_frequencies(frequencies, max_font_size=None)[source]

    根据词和其频率创建词云。参数是键值对为“单词-词频”的字典。

    返回值为WordCloud对象。

  4. generate_from_text(text)[source]

    根据自然语言文本生成词云。如果您传递已经排序的单词列表,则单词将在输出中出现两次。要删除此重复项,请设置collocations = False。

    Notes 先调用process_text方法,在调用generate_from_frequencies方法。

  5. process_text(text)[source]

    将长文本拆分为单词,消除停用词。

    返回值为键值对为“单词-词频”的字典。

    Notes 也可以使用别的更好的方法来进行单词标记化。

  6. recolor(random_state=None, color_func=None, colormap=None)[source]

    可以应用新着色修改词云的图。参数:

    1. random_state:RandomState, int, or None, default=None

      None为固定的随机状态。若为int,则为随机种子。

    2. color_func:function or None, default=None

    3. colormap:string or matplotlib colormap, default=None

    返回值为WordCloud对象。

  7. to_array()[source]

    返回值为numpy数组(width, height, 3)。

  8. to_file(filename)[source]

    导出为名字是filename的图片。

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值