python词云图

京东搜索螺蛳粉商品评论数据

链接:https://pan.baidu.com/s/1tF2MEy-ZDOCexR1JHA7DnQ
提取码:6kxm

import pandas as pd
from PIL import Image
import numpy
#CalThreeKingdoms.py
import jieba
txt=open("D:/2.txt",'r',encoding="utf-8").read()
words=jieba.lcut(txt)   #jieba库函数
count={}    #创建字典
for word in words:
    if len(word)==1:
        continue
    else:
        count[word]=count.get(word,0)+1
items=list(count.items())   #转换成列表
items.sort(key=lambda x:x[-1],reverse=True)
for i in range(300):
    word,count=items[i]
    print("{0:<10}{1:>5}".format(word,count))
    f = open('词频1.csv', 'a', encoding='gbk')
    f.write('{},{}\n'.format(word,count))
    f.close()

输出词频,并保存为csv文件
把csv文件里的一些不重要的词删掉,再把csv文件保存为词频1.txt

from wordcloud import WordCloud
import matplotlib.pyplot as plt

# 生成词云
def create_word_cloud():
    frequencies = {}
    for line in open("./词频1.txt",encoding='utf8'):#根据词频生成词云
        arr = line.split(",")
        frequencies[arr[0]] = float(arr[1])
    # 打开背景图片
    #color_mask = numpy.array(Image.open('map.png'))
    wc = WordCloud(
    #mask=color_mask,  # 指定背景图形状
                    font_path="simsun.ttc",  # 设置词云字体,支持中文
                       background_color="white", # 词云图的背景颜色                       
                       max_words=120,#词云图里最多显示多少个词
                     max_font_size=60,#设置字体最大值
                       random_state=30,#设置有多少种随机生成状态,即有多少种配色方案
                       #stopwords=stop_words,词云里想要去掉的停词,可以写入txt文档里
                       #读取stopwords:stop_words = open('1.txt',encoding='utf8').read().split("\n")
                       scale=10#数字越大词云图越清晰
    )
    word_cloud = wc.generate_from_frequencies(frequencies)
    # 写词云图片
    word_cloud.to_file("wordcloud2.jpg")#保存为wordcloud2.jpg,可以到wordcloud2.jpg里看词云图
    # 显示词云文件
    plt.imshow(word_cloud)
    plt.axis("off")
    plt.show()

# 根据词频生成词云
create_word_cloud()

在这里插入图片描述

  • 4
    点赞
  • 38
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
以下是生成词云图Python代码,并将结果保存为CSV文件的部分代码: ```python from wordcloud import WordCloud import matplotlib.pyplot as plt import pandas as pd # 生成词云 def create_word_cloud(): frequencies = {} for line in open("./词频1.txt", encoding='utf8'): arr = line.split(",") frequencies\[arr\[0\]\] = float(arr\[1\]) wc = WordCloud( font_path="simsun.ttc", background_color="white", max_words=120, max_font_size=60, random_state=30, scale=10 ) word_cloud = wc.generate_from_frequencies(frequencies) word_cloud.to_file("wordcloud2.jpg") plt.imshow(word_cloud) plt.axis("off") plt.show() # 保存词频数据为CSV文件 def save_word_frequency_to_csv(): df = pd.read_csv('词频1.csv', encoding='gbk') df.to_csv('word_frequency.csv', index=False) # 调用函数生成词云图和保存CSV文件 create_word_cloud() save_word_frequency_to_csv() ``` 请注意,这只是代码的一部分,你需要根据你的具体需求进行适当的修改和调整。另外,你还需要安装相应的库(如wordcloud、matplotlib和pandas)并导入所需的模块。 #### 引用[.reference_title] - *1* *2* [python词云图](https://blog.csdn.net/qq_52691614/article/details/121589578)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [小福利,带大家用python一起学做词云图](https://blog.csdn.net/littlespider889/article/details/106731737)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

铃音.

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值