【Python】文本情感分析及绘制词云

本文介绍了如何使用Python进行文本情感分析和绘制词云。主要包括文本预处理、分词、去除停用词、词频统计、情感分析以及利用自定义背景图生成词云并保存到本地的过程。
摘要由CSDN通过智能技术生成

码字不易,喜欢请点赞!!!

这篇文章主要分享了使用Python来对文本数据进行情感分析以及绘制词云。
主要步骤包括:
1.文本预处理
2.文本分词
3.去除停用词(这里设置为单个词和一些常见的停用词)
4.词频统计
5.情感分析
6.绘制词云

首先导入所需的程序办和文本数据:

#带入程序包
import pandas as pd
import re
import jieba
import collections
from wordcloud import WordCloud, ImageColorGenerator, STOPWORDS
import matplotlib.pyplot as plt
from PIL import Image

#读取数据
path = r"data.txt"
with open(path) as f:
    data = f.read()

1.使用正则表达式对文本数据进行预处理,这里主要去除数据的一些没用的符号

# 文本预处理
pattern = re.compile(u'\t|\n|\.|-|:|;|\)|\(|\?|"')
data = re.sub(pattern, '', data)

2.使用精准模式对文本进行分词

# 文本分词--精确模式分词
seg_list_exact  = jieba.cut(data,cut_all = False)

3.去除停用词,这里主要去除了一些常见的停用词和单个词

object_list = []
# 自定义常见去除词库
remove_words = [u'的'
  • 43
    点赞
  • 269
    收藏
    觉得还不错? 一键收藏
  • 18
    评论
评论 18
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值