Pandas的30个高频函数使用介绍

宇宙大豹发

已于 2024-08-10 15:38:32 修改

阅读量850

点赞数 15

文章标签： pandas

于 2024-08-02 17:27:22 首次发布

本文链接：https://blog.csdn.net/2401_85855266/article/details/140874154

版权

Pandas是Python中用于数据分析的一个强大的库，它提供了许多功能丰富的函数。本文介绍其中高频使用的30个函数。
在这里插入图片描述

read_csv(): 从CSV文件中读取数据并创建DataFrame对象。

import pandas as pd   
df = pd.read_csv('data.csv')

read_excel(): 从Excel文件中读取数据并创建DataFrame对象。

df = pd.read_excel('data.xlsx')

to_excel(): 输出数据并保存在新的excel文件中。

df.to_excel('data_output.xlsx')

head(): 返回前n行数据（默认为5）。

print(df.head(5))

tail(): 返回最后n行数据（默认为5）。

print(df.tail(5))

shape: 返回DataFrame的形状（行数和列数）。

rows, cols = df.shape   
print(f"Rows: {rows}, Columns: {cols}")

columns: 返回DataFrame的列名列表。

column_names = df.columns   
print(column_names)

index: 返回DataFrame的索引列表。

index_list = df.index   
print(index_list)

describe(): 生成描述性统计信息，包括计数、平均值、标准差等。

statistics = df.describe()   
print(statistics)

info(): 返回DataFrame的信息摘要，包括索引、列、非空值数量和内存信息。

print(df.info())

dtypes: 返回每列的数据类型。

data_types = df.dtypes   
print(data_types)

drop(): 删除指定行或列。

df = df.drop('column_name', axis=1)

sort_values(): 根据指定列的值对DataFrame进行排序。

df_sorted = df.sort_values('column_name')

loc[]: 通过标签选择数据。

df=pd.DataFrame({'Column1': [1,0,0,0,0,0,2,2],      
 'Column2': [1,1,0,0,0,0,2,2],     
 'Column3': [0,0,0,1,0,0,2,2],      
 'Column4': [1,0,0,1,0,0,2,2]})   
df.loc[:,'Column2']

iloc[]: 通过整数位置选择数据。

cell_data = df.iloc[1, 2]

at[]: 选择单个元素。

element_value = df.at[1, 'Column4']

iat[]: 选择单个元素。

element_value = df.iat[1, 2]

isnull(): 检查缺失值。

missing_values = df.isnull()

notnull(): 检查非缺失值。

non_missing_values = df.notnull()

fillna(): 填充缺失值。

df_filled = df.fillna(0)

replace(): 替换值。

df_replaced = df.replace(old_value, new_value)

rename(): 重命名列名。

df_renamed = df.rename(columns={'old_name': 'new_name'})

set_index(): 设置索引列。

df_indexed = df.set_index('column_name')

reset_index(): 重置索引。

df_reset = df.reset_index()

groupby(): 根据指定列对数据进行分组。

grouped = df.groupby('column_name')

agg(): 对分组后的数据应用聚合函数。

aggregated = grouped.agg({'column_name': ['sum', 'mean']})

unique(): 查找该列唯一值。

df=pd.DataFrame({'Column1': [1,0,0,0,0,0,2,2],       
 'Column2': [1,1,0,0,0,0,2,2],      
 'Column3': [0,0,0,1,0,0,2,2],       
 'Column4': [1,0,0,1,0,0,2,2]})   
list(df['Column1'].unique())#唯一值是0，1，2

concat(): 连接两个或多个DataFrame。

df_concatenated = pd.concat([df1, df2])

merge(): 合并两个DataFrame，根据一个或多个键进行连接。

merged_df = pd.merge(df1, df2, on='key')

apply(): 应用函数至指定行或列。

df['new_column'] = df['column_name'].apply(lambda x: x * 2)  # 对列应用函数

以上这些函数覆盖了从数据加载、预处理、转换到分析的各个阶段。Pandas的强大之处在于其函数的灵活性和易用性，使得数据分析工作变得简单高效。

关于Python技术提升

由于文章篇幅有限，文档资料内容较多，需要这些文档的朋友，可以加小助手微信免费获取，【保证100%免费】，中国人不骗中国人。

在这里插入图片描述

                                     **（扫码立即免费领取）**

全套Python学习资料分享：

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了，还有环境配置的教程，给大家节省了很多时间。

三、全套PDF电子书

书籍的好处就在于权威和体系健全，刚开始学习的时候你可以只看视频或者听某个人讲课，但等你学完之后，你觉得你掌握了，这时候建议还是得去看一下书籍，看权威技术书籍也是每个程序员必经之路。

四、入门学习视频全套

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了。

五、实战案例

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述

如有侵权，请联系删除。

宇宙大豹发

关注

15
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
Pandas的30个高频函数使用介绍

Pandas是Python中用于数据分析的一个强大的库，它提供了许多功能丰富的函数。本文介绍其中高频使用的30个函数。read_csv()以上这些函数覆盖了从数据加载、预处理、转换到分析的各个阶段。Pandas的强大之处在于其函数的灵活性和易用性，使得数据分析工作变得简单高效。
复制链接

扫一扫