自行测试,欢迎交流,使用前安转所需内容。
一、 下面是一次利用python编程对文本分析的测试
1.词频图生成代码
import pandas as pd
from collections import Counter
from textblob import TextBlob
from wordcloud import WordCloud
import matplotlib.pyplot as plt
import jieba
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置中文字体为SimHei
plt.rcParams['axes.unicode_minus'] = False # 解决负号'-'显示为方块的问题
# 读取Excel文件
data = pd.read_csv(r'你的文件路径')
import re
# 去除中文标点符号
data['你需要提取的一列内容标题'] = data['你需要提取的一列内容标题'].apply(lambda x: re.sub(r'[^\w\s]','', x))
# 创建停用词列表(txt文件是自行在网上搜索“最全中文停用词表”保存到同一目录,文章----最下面)
stopwords = set(line.strip() for line in open('ting.txt', encoding='UTF-8'))
# 分词并去除停用词
words = []
for comment in data['你需要提取的一列内容标题']:
words.extend([word for word in jieba.