txt文件按空格分词转化成列表，并绘制词云

兔斯基不吃吐司

已于 2022-06-06 11:02:19 修改

阅读量535

点赞数

分类专栏：代码文章标签： python list

于 2022-06-02 14:44:38 首次发布

本文链接：https://blog.csdn.net/weixin_42105882/article/details/125099923

版权

代码专栏收录该内容

12 篇文章

订阅专栏

该博客使用Python对数据进行处理，通过读取data/data.txt文件，利用split()函数将每行内容拆分为列表，并合并为单一列表。接着，运用Counter进行词频统计，生成词频字典。最后，使用WordCloud库创建词云图，背景采用'data/pl.jpg'图片，显示了文件中高频词汇的分布情况。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

txt文件：

在这里插入图片描述

data = []
with open('data/data.txt','r', encoding='utf-8') as f:
    for line in f:  # 读取每行,line是字符串格式
        '''split()：将字符串按空格分成列表'''
        data.append(line.split())
print(data)

在这里插入图片描述

'''将嵌套的列表合并成一个列表'''
merge=sum(data,[])
print(merge)

在这里插入图片描述

from wordcloud import WordCloud
from collections import Counter
'''使用函数Counter，可以迅速获取list中每个元素出现的次数'''
'''还会按照次数从大到小排序'''
freq_pos = Counter(merge)
print(freq_pos)

在这里插入图片描述

'''绘制词云'''
backgroud_Image=plt.imread('data/pl.jpg')
wordcloud = WordCloud(font_path="STZHONGS.ttf",
                      max_words=50,
                      background_color='white',
                      mask=backgroud_Image)
pos_wordcloud = wordcloud.fit_words(freq_pos)
plt.imshow(pos_wordcloud)
plt.axis('off') 
plt.show()