python3使用flask框架搭建在线词云应用

本文介绍了如何使用python3的flask框架结合jieba、scipy和wordcloud库来搭建一个在线词云应用。通过jieba进行中文文本分词,scipy进行图像处理,wordcloud生成词云。应用中包含了路由设置、文件上传下载以及词云图片的展示。完整代码已上传至github。
摘要由CSDN通过智能技术生成

词云生成

词云生成调用了python中的几个功能强大的包,实现文本切割、图像处理和词云生成。

  • jieba
    jieba是python中用于中文文本分词的模块,支持多种切分模式,并且可以自定义停用词表,去除无意义的词。
  • scipy
    scipy是python中一个用于科学计算的包,其中的misc模块中提供了一些图像处理的函数,这里主要用了imread()和imsave()函数进行图像读取、二值化和存储。
  • wordcloud
    wordcloud是一个词云生成的包,可以根据输入文本串生成词云图。

下面介绍代码(分词和词云生成):
分词采用python的jieba模块,实现文本清洗,分词和去停用词处理。

class word_spliter():
    def __init__(self,text,stop_path = sw_path):
        self.text = text
        self.stop_word = stop_path

    def get_stopword(self):
        stopwords = {}.fromkeys([line.rstrip() for line in open(self.stop_word, encoding='utf-8')])
        return stopwords

    def text_wash(self):
        self.text = self.text.encode(encoding="utf-8",errors='ignore').decode(&
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值