词云操作_中/英文文本

#第一次写文章,不足之处还请给位大佬批评指正##

##中文文本词云

import jieba
import wordcloud

def getText():
    f = open(fname,"r",encoding="utf-8")
    t = f.read()    #读出来,存在t中使以字符的形式
    f.close()
    ls = jieba.lcut(t)   #采用jieba库分词,返回一个列表类型
    txt = " ".join(ls)   #此时返回的为字符串类型
    return txt

print("请输入打开路径及中文文件名:")
fname = input()
txt = getText()   #txt为以空格分隔的字符串
w = wordcloud.WordCloud(font_path = "msyh.ttc",width = 1000,height = 700,\
                        background_color = "white")
# font_path = "msyh.ttc"    作用为设置字体为微软雅黑
w.generate(txt)
w.to_file("C词云.png")

##英文文本词云

#英文词云
import wordcloud
from time import sleep

def getText():
    txt = open(fname,"r").read()  #打开文件,读取文件
    txt = txt.lower()  #将英文字符全改为小写
    for ch in '!"#$%&()*+,-./:;<=>?@[\\]^_{|}·~‘’':
        txt = txt.replace(ch," ")  #遍历文本中的特殊符号,替换为空格
    return txt

print("请输入打开路径及英文文件名:")
fname = input()
txt = getText()   #txt为以空格分隔的字符串
w = wordcloud.WordCloud(width=1000,height=700,max_words=1000)
w.generate(txt)
w.to_file("E词云.png")

sleep(3)

###这两个词云文件分别实现了对中文.txt文件和英文.txt文件词云生成的操作,起初用作某篇文章的提取关键信息,后来无聊用作qq聊天记录文件操作,此程序还在起步阶段,只能部分智能化,暂且作为一个模块,后期会结合爬虫抓取网页文件,生成不同形状的词云图片,不足之处还请各位大佬指正!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值