Python提取Excel表格数据并用DataFrame处理求平均值输出

武者小路

已于 2023-10-17 09:30:49 修改

阅读量3.3w

点赞数 14

于 2018-10-17 14:19:05 首次发布

本文链接：https://blog.csdn.net/qq_41815357/article/details/83109028

版权

python 同时被 3 个专栏收录

7 篇文章

订阅专栏

pandas

3 篇文章

订阅专栏

文件操作

2 篇文章

订阅专栏

Python读取Excel文件取平均数

1.文件读取

下面我们将对这个excel文件进行读取
在这里插入图片描述

import xlrd                           #xlrd是excel文件读取库 只读写
data = xlrd.open_workbook('a.xlsx')   #打开excel文件
table = data.sheets()[0]              #打开第一张表格
nrows = table.nrows                   #获取表格的行数

接下来利用For循环对每行进行处理，处理的目的是把想要的数据存储在列表当中

for i in range(nrows):
	name_.append(table.row_values(i)[0])
	data_.append(table.row_values(i)[2:5])

2.整合为字典

这一步是获取数据后第一个要处理的关键
初始化字典的方法有许多
但是最常用的方法还是使用
zip
可以把两个对应位置的列表进行整合为字典

dict_data = dict(zip(name_,data_))

输出结果在这里插入图片描述

再根据字典输出为DataFrame

data  = pd.DataFrame(dict_data,index=['政治','纪律','品德','学习'])

再进行转置输出

data.T

在这里插入图片描述

2.平均数的读取

 data.mean(axis = 1)

mean（）里面axis表示的是坐标轴，axis = 0表示对纵向求平均值，axis = 1表示对横向求平均值
在这里插入图片描述

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

武者小路

关注关注

14
点赞
踩
141

收藏

觉得还不错? 一键收藏
3
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

python计算excel平均值_python计算excel平均值和标准差

weixin_42144199的博客

01-30

7868

###################################################### python计算excel平均值和标准差 #####################################################‘‘‘:数据源格式编号时间仪器1仪器2仪器3仪器4仪器5仪器6仪器7仪器8仪器9仪器10分组均值标准差FKQXK-r-02-012020...

python计算excel表中每列的平均数_利用pandas和numpy计算表中每一列的均值

weixin_39717121的博客

12-04

9243

importnumpy as npimportpandas as pddf= pd.DataFrame({'var1':np.random.rand(100), #生成100个0到1之间的随机数'var2':100,'var3':np.random.choice([20,30,90]) #在这几个数之间选择})for col indf.columns:print("该列数...

3 条评论您还未登录，请先登录后发表或查看评论

Python处理Excel数据的方法

最新发布

百晓生说测试的博客

04-11

860

与xls相比，它可以存储1048576行、16384列数据，存储相同数据，xlsx格式要比xls格式文件要小得很多。xlwt模块只能写xls文件，不能写xlsx文件(写xlsx程序不会报错，但最后文件无法直接打开，会报错)。我们在日常工作中常常见到各种后缀的电子表格，例如最常见的xlsx以及较为常见的csv、xls等格式的表格。openpyxl模块可实现对excel文件的读、写和修改，只能处理xlsx文件，不能处理xls文件。当收到的文件既有xls，又有xlsx时，先转换为统一格式再做统计修改更方便。

使用Python读取Excel文件并计算平均分

嘻嘻爱编码的博客

03-27

1942

使用Python读取Excel文件并计算平均分

python 求excel每列平均值并追加写入到最后一行读取修改表格

软件工程小施同学的专栏

07-14

7752

# -*- encoding: utf-8 -*- # 读取excel表格 import xlrd from xlutils.copy import copy ## 第一步，读取 # excel表格在哪里 filename = "./students.xls" workbook = xlrd.open_workbook(filename) sheetnames = workbook.sheet_names() sheetwork = workbook.sheet_by_name(sheet...

Python处理Excel求取某列固定间隔数的平均值

Lucius26的博客

09-15

3768

需求：需要取某列数据在相同时间段内的平均值，比如：每5min取一次。思路：读入的数据格式为DataFrame，先通过 df['某列'][ i:j] 的形式取数，用循环可以依次取数成Serise格式，循环里面用append函数将每次循环值填入空列表中，完成需求！ Data_0 = [] i = 0 while i <= len(df): Data0 = df['A列'][i:i+300] #每间隔300个数据取一次数 Data1 = sum(Data0)/len(Data0)

Python应用实战代码-python爬取股票最新数据并用excel绘制树状图

07-20

Python的`pandas`库提供了一个高效的数据框（DataFrame）对象，非常适合处理表格型数据。你可以将解析出的股票数据保存为DataFrame，并使用`to_csv()`方法将其导出为CSV文件。 5. **数据分析**：`pandas`库提供了...

python处理excel表常用知识

weixin_45211921的博客

04-01

790

python处理表格的常用知识 1. 读取或者连接excel 借助pandas模块（需要先安装pandas模块） import pandas as pd data=pd.read_excel('C:\\Users\\C++成绩.xls',sheet_name=0,header=1) print(data) #将表格全部显示出来 sheet_name=0的意思就是该excel中所有sheet都可以提取如果你想提取某sheet_name=1 就是提取该excel中第一个sheet heard 属性

机器学习（1）——Python数据处理与绘图

WHJ226的博客

06-14

5171

目录1 numpy数组使用1.1 numpy生成数组1.2 numpy数组属性1.3 数组的索引和切片1.4 numpy数组运算2 scipy包的使用2.1 scipy包中的模块2.2 常数模块的使用2.3 特殊函数模块的使用2.4 信号处理模块2.5 空间结构模块3 pandas包的使用3.1 pandas数组3.2 查看数据3.3 pandas读取文件4 matplotlib包的使用4.1 正余弦曲线4.2 一张图中的不同曲线 4.3 三维曲线图4.4 其他类型曲线Python具有强大的数据处理能力，

【Python与Excel无缝连接】：深入探讨数据提取的各种场景与应用

从基础连接方法入手，详细介绍了数据提取与处理技术，包括理解和操作Excel数据模型、高级数据提取技术、以及数据清洗和预处理步骤。在此基础上，针对金融数据分析、市场调查分析和人力资源管理等特定场景，展示了...

Python数据分析与挖掘进阶篇1——异常值分析、一致性分析、数据特征分析等（附实例！）

别看我只是一只羊

11-25

5866

初探Python数据分析day2 自我介绍一下，我是一名大四应届毕业生对数据挖掘方面很感兴趣，最近开始着手系统学习，在这里与大家分享我的学习笔记与心得，如果不足或错误请大家指出，感谢。一、数据探索根据观测、调查收集到初步的样本数据集后，接下来要考虑的问题是:样本数据集的数量和质量是否满足模型构建的要求?是否出现从未设想...

winforms 动态画折线不用chart_SAST Weekly | TikZ画万物

weixin_39646412的博客

12-04

265

SAST weekly 是由电子工程系学生科协推出的科技系列推送，内容涵盖信息领域技术科普、研究前沿热点介绍、科技新闻跟进探索等多个方面，帮助同学们增长姿势，开拓眼界，每周更新，欢迎关注！欢迎愿意分享知识的同学投稿至 eesast@mail.tsinghua.edu.cn , 期待你的作品！TikZ是什么？TikZ ist kein Zeichenprogramm(TikZ不是一个绘图程...

python求三个数平均值_使用python3读取处理excel表的数据内容如何对内容求平均值 |...

weixin_39846186的博客

11-24

1039

如何使用python或者宏对excel中数据进行统计重复次数这会写这样的代码！要看你具体的Excel文档，不好妄自揣测。(如果不方便可以根据实际情况模拟数据)python 如何读取 excel 指定单元格内容1、首先在filepathName = pd.read_excel(filepathName, sep='') #表格中数据。2、然后ws = wb.worksheets[0] #获取表格定工...

python计算excel每个月的平均值_Python:根据日期计算平均值并根据月份显示

weixin_31321851的博客

02-11

5547

首先把你的数据放到panda数据框中——我自己编了一个虚拟数据——你需要弄清楚如何加载你的数据源。(来自csv或excel)。启动框架import pandas as pdimport datetimedf1 = pd.DataFrame({'Start_date' : ['2018-01-01','2018-01-02','2018-01-03','2018-02-01','2018-03-10...

【python中的pandas——对excel每隔12列做一次均值计算】

youverybad的博客

02-29

563

【代码】【使用pandas——对excel每隔12列做平均值计算】

Python pandas将excel的数据按月份分组求平均

charling____的博客

10-24

1万+

先观察一下要处理的数据是怎样的，原始文件是有五组分隔开的数据，第一行是表示组名，第二行是列标签，第三行开始才是真正的数据。很容易就会想到使用pandas来处理这个文件了。首先读取文件并创建一个dataframe对象 import pandas as pd df = pd.read_excel('use_nofillvalue(1).xlsx') 查看df的内容，可以看到列标签很多都是Unamed，是因为本来文件表格就是空的，因此也读取不到内容。而后面使用mean()求平均时，要使用标签Year和Mon

Python数据分析实战-提取DataFrame（Excel）某列（字段）最全操作（附源码和实现效果）

数据杂坛

02-20

5279

Python数据分析实战-提取DataFrame（Excel）某列（字段）最全操作（附源码和实现效果）

Python pandas Dataframe 求解每列/行的均值

热门推荐

cloud_wu9的博客

11-29

2万+

Python pandas Dataframe 求解每列/行的均值 col_mean = df.mean(axis=0) row_mean = df.mean(asxis=1) axis: 0 是列 1是行

python 按日期筛选数据并计算均值

qq_32649321的博客

06-30

4869

转载：https://blog.csdn.net/weixin_42782150/article/details/90716533 目的：主要将date相同的数据提取出来，并计算均值。即根据某一列进行分组（groupby函数），再进行运算。代码： import numpy as np import pandas as pd #read excel file excel_path = r'path to .xls file' data = pd.read_excel(excel_path) data['

读取以下4位同学的成绩，用一个数据框变量pd进行保存，并将成绩保存在一 (2)对df第3 1.创建一个Python脚本、命名为test1.py，实现以下功能。用自身的方法转换 (3)基于df TXT文件中，如图3-30所示。文件(内编描注概式(O)查看(V)帮助(H0 于等于2017-01-0 成绩单·记事本小红，语文，100 (4)以逻辑姓名，科目，成绩小红，英语,90小红,数学，75张明，语文，80张明，英语，76张明,数学,88小江,语文，79小江,数学，120小江，英语，80小李,英语，87小李,语文,99小李,数学，76 图3-30 (2)对数据框变量pd进行切片操作，分别获得小红、张明、小江、小李的各科成绩，它们是4个数据框变量，分别记为pdl、pd2、pd3、pd4。 (3)利用数据框中自身的聚合计算方法，计算并获得每个同学各科成绩的平均分，记为 M1、M2、M3、M4。 2.创建一个 Python 脚本，命名为test2.py，实现以下功能。 (1)读取以下Excel表格的数据并用一个数据框变量df保存，数据内容如表3-1所示。表3-1

03-26

以下是关于如何完成上述任务的一个简单介绍：我们先从第一部分的任务开始，即通过给定的成绩单数据生成一个Pandas DataFrame，并对其进行处理。 ### 创建 `test1.py` #### 第一步：构建DataFrame 可以使用`pandas.DataFrame()`函数来创建DataFrame。首先导入必要的库： ```python import pandas as pd # 构建初始的数据列表 data = [ ['小红', '语文', 100], ['小红', '英语', 90], ['小红', '数学', 75], ['张明', '语文', 80], ['张明', '英语', 76], ['张明', '数学', 88], ['小江', '语文', 79], ['小江', '数学', 120], ['小江', '英语', 80], ['小李', '英语', 87], ['小李', '语文', 99], ['小李', '数学', 76] ] # 将其转化为 DataFrame 格式 columns_name = ['姓名', '科目', '成绩'] df = pd.DataFrame(data, columns=columns_name) ``` #### 第二步：切片获取各个学生的成绩这里我们可以按照名字筛选出特定学生的所有行记录。例如对于“小红”的所有课程分数可以用下面的方式提取出来： ```python # 获取每位同学的成绩 (按姓名过滤) pdl = df[df['姓名'] == '小红'].reset_index(drop=True) # 小红的成绩 pd2 = df[df['姓名'] == '张明'].reset_index(drop=True) # 张明的成绩 pd3 = df[df['姓名'] == '小江'].reset_index(drop=True) # 小江的成绩 pd4 = df[df['姓名'] == '小李'].reset_index(drop=True) # 小李的成绩 ``` #### 第三步：计算每人的平均分接着就是利用 Pandas 的 `.groupby()` 和 `.mean()` 函数来进行聚合操作，得到每个人的平均分。 ```python # 计算每人各科目的平均值 M1 = round(pdl.groupby('科目')['成绩'].mean(), 2).to_dict() # 小红的平均分字典形式返回 M2 = round(pd2.groupby('科目')['成绩'].mean(), 2).to_dict() M3 = round(pd3.groupby('科目')['成绩'].mean(), 2).to_dict() M4 = round(pd4.groupby('科目')['成绩'].mean(), 2).to_dict() print("小红:", M1) print("张明:", M2) print("小江:", M3) print("小李:", M4) ``` --- 接下来是第二部分内容——`test2.py`脚本的设计思路。假设 Excel 文件名为 `"grades.xlsx"` 并且包含与上文类似结构化信息，则步骤如下： ```python import pandas as pd # 读取excel文件到 dataframe 中 file_path = "grades.xlsx" df = pd.read_excel(file_path) # 显示前几条数据检查是否成功加载了正确的 excel 数据源 print(df.head()) # 按照需求继续做数据分析或其他指定的操作... ``` 如果需要更进一步地分析该数据集的话还可以参考第一步中的逻辑进行切割和统计等其他高级运算。