Pandas Excel数据处理指南(1)，Golangstudio基础

最新推荐文章于 2024-04-28 10:33:09 发布

2401_84254406

最新推荐文章于 2024-04-28 10:33:09 发布

阅读量1k

点赞数 24

分类专栏： 2024年程序员学习文章标签： pandas excel

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84254406/article/details/137772034

版权

2024年程序员学习专栏收录该内容

96 篇文章 0 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新Golang全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上Go语言开发知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024b （备注go）

正文

df = pd.read_excel(‘file.xlsx’, sheet_name=‘Sheet1’)

上述代码中，file.xlsx是要读取的Excel文件的路径和文件名，Sheet1是要读取的工作表的名称。如果不指定sheet_name参数，默认读取第一个工作表的内容。

Pandas还提供了一些其他的参数，用于控制读取数据的方式。例如，可以使用header参数指定表头所在的行数，使用skiprows参数指定要跳过的行数等。

读取Excel文件后，数据将存储在一个名为df的DataFrame对象中。可以使用head()方法来查看DataFrame的前几行数据：

print(df.head())

数据处理和清洗

一旦数据加载到Pandas的DataFrame中，我们可以对其进行各种处理和清洗操作。以下是一些常见的数据处理技巧：

选择特定列

如果只需要处理特定列的数据，可以使用DataFrame的列名进行选择。例如，要选择名为column1和column2的列，可以使用如下代码：

selected_columns = df[[‘column1’, ‘column2’]]

上述代码将选取column1和column2两列的数据，并将其存储在selected_columns变量中。这样我们就可以只对这些列进行后续的处理。

过滤数据

有时候我们可能需要根据某些条件来过滤数据。例如，我们只想保留某个列中数值大于10的行。可以使用条件过滤来实现这一点：

filtered_data = df[df[‘column’] > 10]

上述代码将选择column列中数值大于10的行，并将结果存储在filtered_data变量中。我们可以根据需要修改条件来进行过滤操作。

处理缺失值

在实际数据中，常常会遇到缺失值的情况。Pandas提供了一些方法来处理和填充缺失值。例如，可以使用fillna()方法将缺失值填充为指定的值：

df_filled = df.fillna(0)

上述代码将DataFrame中的所有缺失值填充为0。还可以使用其他方法来填充缺失值，例如使用前一个非缺失值填充或使用平均值填充。

数据转换

有时候我们需要对数据进行转换，例如将数据类型转换为其他类型，或者对数据进行重塑。Pandas提供了一些方法来实现这些转换。以下是一些常见的数据转换技巧：

将某一列的数据类型转换为数值类型：

df[‘column’] = pd.to_numeric(df[‘column’])

将某一列的数据类型转换为日期类型：

df[‘date_column’] = pd.to_datetime(df[‘date_column’])

对数据进行重塑，例如使用pivot_table()方法进行数据透视：

pivot_table = df.pivot_table(index=‘column1’, columns=‘column2’, values=‘value_column’)

这些是一些常见的数据处理和清洗操作，可以根据实际需求使用Pandas提供的方法和函数进行灵活处理。

数据分析和计算

Pandas不仅可以对数据进行处理和清洗，还提供了丰富的数据分析和计算功能。以下是一些常见的数据分析和计算技巧：

描述性统计

可以使用describe()方法来计算DataFrame中数值列的描述性统计信息，例如计数、均值、标准差、最小值、最大值等：

stats = df.describe()

上述代码将计算DataFrame中数值列的描述性统计信息，并将结果存储在stats变量中。

分组和聚合

Pandas提供了强大的分组和聚合功能，可以根据某些列的值将数据进行分组，并对分组后的数据进行各种聚合操作。以下是一些常见的分组和聚合技巧：

使用groupby()方法对数据进行分组：

grouped_data = df.groupby(‘column’)

计算每个分组中的平均值、总和、计数等：

group_stats = grouped_data.mean()

对多个列进行分组和聚合操作：

multi_group_stats = df.groupby([‘column1’, ‘column2’]).sum()

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注Go）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
化的资料的朋友，可以添加V获取：vip1024b （备注Go）**
[外链图片转存中…(img-pTAeHSNl-1713148960911)]

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

关注

24
点赞
踩
28

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

普通网友 CSDN认证博客专家 CSDN认证企业博客

码龄172天

112: 原创

-: 周排名

-: 总排名

8万+: 访问

: 等级

2851: 积分

1186: 粉丝

1516: 获赞

1: 评论

1547: 收藏

私信

关注

热门文章

分类专栏

2024年程序员学习 96篇
程序员 16篇

最新评论

STM32单片机学习教程_stm32单片机教程
好家伙VCC: 博主写的真棒！我最近也写关于使用 STM32CubeMX 开发，STM32+openmv通信的 PID 控制遥控避障跟随循迹的文章和视频，大家可以一起交流学习一下，这是文章:https://blog.csdn.net/qq_46187594/article/details/138110155?spm=1001.2014.3001.5502 这个是视频:https://www.bilibili.com/video/BV16x4y1M7EN/?spm_id_from=333.337.search-card.all.click
spark向hbase写入数据报错：tried to access method com
普通网友: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
论文阅读笔记三遍阅读详解知识图谱入门之作(A Survey on Knowledge Graphs)_知识图谱survey
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【Linux - mysql】怎么修改数据库编码，2024Linux运维进阶新篇章
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。