python统计excel文本单元格_Python统计excel表格中文本的词频，生成词云图片

最新推荐文章于 2024-01-26 15:55:08 发布

weixin_39553156

最新推荐文章于 2024-01-26 15:55:08 发布

阅读量310

点赞数

文章标签： python统计excel文本单元格

import xlrd

import jieba

import pymysql

import matplotlib.pylab as plt

from wordcloud import WordCloud

from collections import Counter

import numpy as np

def getExcelData(excel,txt):

readbook = xlrd.open_workbook(excel)

sheet = readbook.sheet_by_index(2) #取第二个sheet页

rows = sheet.nrows

i = 0

while i < rows:

txt += sheet.cell(i, 2).value #取第三列的值

i += 1

seg_list = jieba.cut(txt)

c = Counter()

result = {}

for x in seg_list:

if len(x) > 1 and x != ‘\r\n‘:

c[x] += 1

for (k, v) in c.most_common():

result[k] = v #放到字典中，用于生成词云的源数据

return result

def makeWordCloud(txt):

x, y = np.ogrid[:300, :500]

mask = (x - 150) ** 2 + (y - 150) ** 2 > 150 ** 2

mask = 255 * mask.astype(int)

wc = WordCloud(background_color="white",

max_words=500,

mask=mask,

repeat=True,

width=1000,

height=1000,

scale=4, #这个数值越大，产生的图片分辨率越高，字迹越清晰

font_path="C:\Windows\Fonts\STXINGKA.TTF")

wc.generate_from_frequencies(txt)

wc.to_file(‘abc.png‘)

plt.axis("off")

plt.imshow(wc, interpolation="bilinear")

plt.show()

if __name__ == ‘__main__‘:

txt = ‘‘

makeWordCloud(getExcelData(‘getdata.xlsx‘, txt))

原文：https://www.cnblogs.com/ning-blogs/p/10491361.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39553156

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python统计excel 表中某一列文本的词频

qq_44965200的博客

12-18

1万+

` python统计excel 表中某一列文本的词频代码如下 # jieba库的使用以及csv库的使用 import jieba import csv txt = open("complaint.csv", 'rt', encoding='utf-8').read() # 读取所需要分析的文件内容 Excel = open("baoGao.csv", 'w', newline='') # 打开表格文件，若表格文件不存在则创建 writ = csv.writer(Excel) # 创建一个csv的w

python用jieba对文本就行分词并统计词频_python jieba分词并统计词频后输出结果到Excel和txt文档方法...

weixin_39624367的博客

11-28

897

前两天，班上同学写论文，需要将很多篇论文题目按照中文的习惯分词并统计每个词出现的频率。让我帮她实现这个功能，我在网上查了之后发现jieba这个库还挺不错的。运行环境：安装jieba：pip install jieba安装xlwt：pip install xlwt具体代码如下：#!/usr/bin/python# -*- coding:utf-8 -*-import sysreload(sys)sy...

参与评论您还未登录，请先登录后发表或查看评论

python处理excel词频统计

EaSoNgo111的博客

04-06

2341

用于对文章内容进行分词和统计词频。然后，我们遍历每个主题，筛选符合条件的行，并将文章内容合并为一个字符串。接着，将文章内容传递给。函数进行分词和统计词频，并将统计结果写入新数据框。最后，将新数据框存储到 Excel 文件中。

python实现对表格某一列内容统计高频次的字

热门推荐

liu506039293的博客

01-14

1万+

文章目录1.需要的库2.代码逻辑3.分块功能说明3.1统计词频3.2过滤3.3生成词云4.结果图5.工程代码 1.需要的库 pip install pandas pkuseg numpy matplotlib PIL wordcloud pkuseg是一个分词器：https://github.com/lancopku/pkuseg-python pandas,matplottlib,PIL 用来...

python统计excel词频

06-10

要统计Excel中的词频，可以使用Python中的pandas和nltk库来实现。首先，需要使用pandas读取Excel文件： ```python import pandas as pd df = pd.read_excel('example.xlsx') ``` 接着，将所有单元格的文本合并...

python对excel数据统计_工具篇：EXCEL与python的对比如何统计数据.md

weixin_39799307的博客

11-24

317

工具篇：EXCEL与python的对比如何统计数据第8章数据统计本章主要介绍数据采样，标准差，协方差和相关系数的使用方法1. 数据采样Excel的数据分析功能中提供了数据抽样的功能，如下图所示。Python通过sample函数完成数据采样Sample是进行数据采样的函数，设置n的数量就可以了。函数自动返回参与的结果。#简单的数据采样df_inner.sample(n=3)Weights参数是...

Python多张Excel找关键字并生成新的Excel

06-03

在多张表里面找到想要的关键字，并且生成新的表，每张表内如果有关键字会生成一个sheet表会生成列表和关键字的对应行，在数据库里多张数据表找关键字时可以导出成Excel快速定位在那张表并且列名是什么。

python 提取EXCEL指定内容，指定特定词汇生成词云图

merry_pc的博客

07-22

1278

python excel jieba 云图

用Python实现一个词频统计(词云+图）

weixin_30700977的博客

04-04

1万+

第一步：首先需要安装工具python 第二步：在电脑cmd后台下载安装如下工具：（有一些是安装好python电脑自带有哦）有一些会出现一种情况就是安装不了词云展示库有下面解决方法，需看请复制链接查看：https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 第三步： 1.准备好你打算统计的文件，命名为家.txt，保...

q learning简单理解_用线性回归拟合案例，透彻理解深度学习的反向传播

weixin_39768083的博客

11-22

447

在深度学习环境安装一文中，我们已经搭建了撸代码的基本环境。现在就可以来正式写代码了。我们今天的目标是模拟线性回归，通过调整参数（斜率k和b）找到和数据最匹配的线性函数。tips: 所有代码都在jupyter notebook中完成自动微分变量首先是引入pytorch，以及包含的自动微分变量包`autograd`import torch from torch.autograd import Vari...

Python实现读取多个excel;以及统计词频；使用词典

weixin_34204722的博客

08-24

1940

# -*- coding: utf8 -*-import xlrdimport codecsimport osdef handExcel(path): #定义输出文件 output1 = codecs.open("7.8_userQue.txt","w","utf-8") output2 = codecs.open("7.8_StandQue.txt","w","utf-8") ...

Python大数据：jieba分词，词频统计

weixin_33778544的博客

03-21

6960

实验目的学习如何读取一个文件学习如何使用DataFrame 学习jieba中文分词组件及停用词处理原理了解Jupyter Notebook 概念中文分词在自然语言处理过程中，为了能更好地处理句子，往往需要把句子拆开分成一个一个的词语，这样能更好的分析句子的特性，这个过程叫就叫做分词。由于中文句子...

python 词频统计_自然语言处理之分词、词云、提取关键词、词频统计

weixin_39958112的博客

12-05

473

通过实战讲解如何处理文本，解决各种编码问题，在实战中学习，最快的学习方法，精华！讲解的非常详细简单，学不会，全额退款哦！！！玩转自然语言处理课程目录如下：自然语言处理之分词、词云、提取关键词、词频统计1分词语法介绍1.1分词方式1.1.1精准模式1.1.2全模式1.1.3搜索引擎模式1.2词性标注1.3加载自定义词典2自动从大量文本中提取关键词、去除停用词、统计词频2.1.1基于TF-IDF算法的...

python画统计图代码_python读取excel某列内容制作词云图并用条形图统计词频

weixin_39907157的博客

11-24

2722

有的时候我们把数据整理收集整理到excel中，那么要把excel中的某列文本数据制作词云图怎么做呢？从最简单的说起。最简单的词云图就是这种，英文的，不读取文件，不指定背景形状图片，不指定字体。#复制文本用字符串表示mytext = "With his wife's encouragement, Minister Hacker decides he should focus on accomplis...

python词频统计完整步骤_python高性能词频统计历程--------功能实现

weixin_39594296的博客

11-22

550

最近在学习Python语言，正好有一个需求可以让我学习Python,这个需求我从刚开始完成其功能，最后到性能的优化，这当中体会到会写和写好的差距，从开始的一个867M的数据消耗时间2772s。到最后只要69s完成，当中巧妙的使用了很多知识点，今天就开始整理整理我是如何一步步做到的，其中又学到了哪些知识点，给大家分享。业务需求：Ø统计每个关键字的总词频，支持正则表达。例如：伤*Ø不同类型的关键字在不...