python生成词云图

目录

1、安装分词工具jieba、词云图库wordcloud

2、分词

3、过滤停用词

4、生成词云图


1、安装分词工具jieba、词云图库wordcloud

编程环境是Anaconda,需要安装jieba、wordcloud。

pip install jieba -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install wordcloud -i https://pypi.tuna.tsinghua.edu.cn/simple

注意需要升级pillow包,如果pillow版本过低,运行时会报错。

pip install --upgrade pillow -i https://pypi.tuna.tsinghua.edu.cn/simple

2、分词

tokenizer函数,接受一段文本,利用jieba分词工具,对文本进行语法分析,将文本从段落的形式转为词语的数组。

import jieba
import re
import json

def tokenizer(text): 
    regex = re.compile(r'[^\u4e00-\u9fa5aA-Za-z0-9]')
    text = regex.sub(' ', text)
    return [word for word in jieba.cut
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值