python3读文件中文_详解Python3解决读取中文文件txt编码的问题

最新推荐文章于 2023-06-19 14:30:07 发布

从夏

最新推荐文章于 2023-06-19 14:30:07 发布

阅读量301

点赞数

文章标签： python3读文件中文

本文链接：https://blog.csdn.net/weixin_29357243/article/details/114927748

版权

import jieba

import jieba.analyse

from matplotlib import pyplot as plt

from scipy.misc import imread

from wordcloud import WordCloud,STOPWORDS,ImageColorGenerator

# 1.读取数据

with open("./test.txt","r",encoding="utf8") as f:

text = f.read()

# 2.基于 TextRank 算法的关键词抽取,top50

keywords = jieba.analyse.textrank(text, topK=50, withWeight=False, allowPOS=('ns', 'n', 'vn', 'v'))

file = ",".join(keywords)

# 指定中文字体，不然中文显示框框

font = r'./HYQiHei-25J.ttf'

print(file)

# 指定背景图,随意

image = imread('cake.jpg')

wc = WordCloud(

font_path=font,

background_color='white',#背景色

mask=image,#背景图

stopwords=STOPWORDS,#设置停用词

max_words=100,#设置最大文字数

max_font_size=100,#设置最大字体

width=800,

height=1000,

)

#生成词云

image_colors = ImageColorGenerator(image)

wc.generate(file)

# 使用matplotlib,显示词云图

plt.imshow(wc) #显示词云图

plt.axis('off') #关闭坐标轴

plt.show()

# 保存图片

wc.to_file('news.png')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

从夏

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python3读文件中文_详解Python3解决读取中文文件txt编码的问题

import jiebaimport jieba.analysefrom matplotlib import pyplot as pltfrom scipy.misc import imreadfrom wordcloud import WordCloud,STOPWORDS,ImageColorGenerator# 1.读取数据with open("./test.txt","r",encodin...
复制链接

扫一扫