利用pycham实现文章中词频、词云、折线图的使用

本文档介绍了如何使用PyCharm进行文本处理,包括引入必要的库,自定义停用词,使用jieba进行中文分词,计算词频,生成词云,以及绘制人物出现次数的折线图。主要涉及的技术包括jieba分词、Python的Counter、WordCloud库和matplotlib库。
摘要由CSDN通过智能技术生成

源文本文档

首先需要引入pycham的各种包

import string

import numpy as np

jieba.load_userdict('七龙珠.txt')

def stop_words():

with open('七龙珠.txt', encoding='utf-8') as f:

return [line.strip() for line in f]

# 对句子进行中文分词

def seg_depart(sentence):

# 对文档中的每一行进行中文分词

sentence_depart = jieba.cut(sentence.strip())

# 创建一个停用词列表

stopwords = stop_words()

# 输出结果为outstr

outstr = ' '

# 去停用词

for word in sent

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值