项目页面:
目标效果:
代码:
import re
import pandas
import jieba
import numpy
import warnings
import matplotlib.pyplot as plt
from wordcloud import WordCloud
warnings.filterwarnings("ignore") #忽略警告
"""读取文件"""
filepath =open('mavel.txt', encoding='utf-8')
fileContent = filepath.read()
filepath.close()
"""处理数据,取汉字"""
pattern = re.compile(r'[\u4e00-\u9fa5]+') #定义一个匹配对象,取出符合条件的中文,\u4e00”和“\u9fa5”是unicode编码,也是中文编码的开始和结束的两个值
filterd