python 可以用excel做词云图嘛_python绘制中文词云图

1. 明确任务

最近学习过程中看到很多分析报告中都有运用到可视化的词云,也有看到五花八门的工具教程,刚好有一份《都挺好》电视剧的弹幕源数据。便决定用这份数据尝试使用python绘制词云。

任务内容1. 在python中读取excel文件(《都挺好》弹幕源数据.xlsx)提取出弹幕内容

2. 对弹幕内容文本进行结巴分词,设置并过滤掉停用词

3. 使用wordcloud 将分词得到的词汇统计绘制词云图

涉及难点1. 读写excel文件

2. jieba 中文分词

3. wordcloud 词云展示库

2. 具体操作

2.1 安装相应的第三方库

本次练习需要使用到的库包括读取excel文件的openpyxl(xlwt、xlrd、pandas),进行分词的jieba,以及进行词云图绘制的numpy、matplotlib、wordcloud。

因为不确定在此前安装过哪些库,因此先使用pip list查看已经安装好的库文件。查询之后发现只有wordcloud和openpyxl没有安装,分别使用pip install openpyxl和pip install wordcloud 即可安装。

2.2 读写文件

读写文件在之前了解过 with open 的方法,用于读写txt,csv文件。但是若要读写excel文件则需要使用特定的库。例如 openpyxl、xlwt/wlrd 以及pandas这几种第三方库来读写。本次使用的是openpyxl来进行的文件读写。

相关部分代码:import openpyxl #此处使用的是openpyxl读取文件,此外还有 xlrd,pandas 读取文件的方式(有待补充)

filename=r'F:\数据分析练手\都挺好-弹幕源数据.x

  • 1
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
以下是生成词云图Python代码,并将结果保存为CSV文件的部分代码: ```python from wordcloud import WordCloud import matplotlib.pyplot as plt import pandas as pd # 生成词云 def create_word_cloud(): frequencies = {} for line in open("./词频1.txt", encoding='utf8'): arr = line.split(",") frequencies\[arr\[0\]\] = float(arr\[1\]) wc = WordCloud( font_path="simsun.ttc", background_color="white", max_words=120, max_font_size=60, random_state=30, scale=10 ) word_cloud = wc.generate_from_frequencies(frequencies) word_cloud.to_file("wordcloud2.jpg") plt.imshow(word_cloud) plt.axis("off") plt.show() # 保存词频数据为CSV文件 def save_word_frequency_to_csv(): df = pd.read_csv('词频1.csv', encoding='gbk') df.to_csv('word_frequency.csv', index=False) # 调用函数生成词云图和保存CSV文件 create_word_cloud() save_word_frequency_to_csv() ``` 请注意,这只是代码的一部分,你需要根据你的具体需求进行适当的修改和调整。另外,你还需要安装相应的库(如wordcloud、matplotlib和pandas)并导入所需的模块。 #### 引用[.reference_title] - *1* *2* [python词云图](https://blog.csdn.net/qq_52691614/article/details/121589578)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] - *3* [小福利,带大家用python一起学词云图](https://blog.csdn.net/littlespider889/article/details/106731737)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insertT0,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值