Pandas常用的35个经典操作

宇宙大豹发

于 2024-07-29 15:47:58 发布

阅读量381

点赞数 9

文章标签： pandas

本文链接：https://blog.csdn.net/2401_85855266/article/details/140772744

版权

pandas是Python最常用的数据处理库之一，本文介绍其最常用的基础操作。

在这里插入图片描述

首先我们需要导入pandas库，并创建一个DataFrame。这里我们使用字典来创建一个简单的DataFrame：

import pandas as pd

data = {
    '姓名': ['张三', '李四', '王五', '赵六'],
    '年龄': [25, 30, 35, 40],
    '性别': ['男', '女', '男', '女']
}

df = pd.DataFrame(data)

接下来，我们将介绍pandas常用的35个经典操作：

查看数据前5行：

print(df.head())

查看数据信息（如数据类型、非空值数量等）：

print(df.info())

查看数据描述性统计信息（如均值、标准差等）：

print(df.describe())

查看数据列名：

print(df.columns)

查看数据索引：

print(df.index)

按列名选择数据：

print(df['姓名'])

按列名修改数据：

df['姓名'] = ['张三丰', '李四光', '王五岳', '赵六令']   
print(df)

按条件筛选数据：

filtered_df = df[df['年龄'] > 30]   
print(filtered_df)

按条件修改数据：

df.loc[df['年龄'] > 30, '年龄'] = 31  
print(df)

按条件删除数据：

df = df[df['年龄'] != 31]   
print(df)

添加新列：

df['城市'] = ['北京', '上海', '广州', '深圳']   
print(df)

删除列：

df = df.drop('城市', axis=1)   
print(df)

重命名列：

df = df.rename(columns={'姓名': '名字'})  
print(df)

设置索引：

df = df.set_index('名字')   
print(df)

重置索引：

df = df.reset_index()   
print(df)

排序：

sorted_df = df.sort_values(by='年龄')   
print(sorted_df)

分组：

grouped_df = df.groupby('性别')   
print(grouped_df.mean())

合并：

data2 = {'名字': ['孙悟空', '猪八戒'], '年龄': [500, 400], '性别': ['男', '男']}
df2 = pd.DataFrame(data2)
merged_df = pd.concat([df, df2])
print(merged_df)

插入数据：

df.loc[1.5] = ['唐僧', 25, '男']   
print(df)

删除数据：

df = df.drop([1, 2])   
print(df)

填充缺失值：

df['年龄'] = df['年龄'].fillna(30)   
print(df)

去除重复值：

df = df.drop_duplicates()   
print(df)

数据透视表：

pivot_table = pd.pivot_table(df, values='年龄', index='名字', columns='性别')   
print(pivot_table)

数据转置：

transposed_df = df.T   
print(transposed_df)

数据合并（按行）：

df3 = pd.DataFrame({'名字': ['白龙马'], '年龄': [300], '性别': ['男']})
merged_df = pd.merge(df, df3, on='名字')
print(merged_df)

数据合并（按列）：

merged_df = pd.merge(df, df3, left_index=True, right_index=True)   
print(merged_df)

数据连接（按行）：

connected_df = pd.concat([df, df3])  
print(connected_df)

数据连接（按列）：

connected_df = pd.concat([df, df3], axis=1)   
print(connected_df)

数据切片：

sliced_df = df[1:3]   
print(sliced_df)

数据迭代：

for index, row in df.iterrows():       
print(row)

数据过滤：

filtered_df = df[(df['年龄'] > 25) & (df['性别'] == '男')]   
print(filtered_df)

数据替换：

df['性别'] = df['性别'].replace('男', 'M')   
print(df)

数据映射：

mapping = {'男': 'M', '女': 'F'}   df['性别'] = df['性别'].map(mapping)   
print(df)

数据透视表（多重索引）：

pivot_table = pd.pivot_table(df, values='年龄', index=['名字', '性别'])   print(pivot_table)

数据透视表（聚合函数）：

pivot_table = pd.pivot_table(df, values='年龄', index='名字', columns='性别', aggfunc='mean')   
print(pivot_table)

关于python技术储备：

由于文章篇幅有限，文档资料内容较多，需要这些文档的朋友，可以加小助手微信免费获取，【保证100%免费】，中国人不骗中国人。

在这里插入图片描述

                                     **（扫码立即免费领取）**

全套Python学习资料分享：

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理，形成各个领域的知识点汇总，它的用处就在于，你可以按照上面的知识点去找对应的学习资源，保证自己学得较为全面。

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了，还有环境配置的教程，给大家节省了很多时间。

三、全套PDF电子书

书籍的好处就在于权威和体系健全，刚开始学习的时候你可以只看视频或者听某个人讲课，但等你学完之后，你觉得你掌握了，这时候建议还是得去看一下书籍，看权威技术书籍也是每个程序员必经之路。

四、入门学习视频全套

我们在看视频学习的时候，不能光动眼动脑不动手，比较科学的学习方法是在理解之后运用它们，这时候练手项目就很适合了。

五、实战案例

光学理论是没用的，要学会跟着一起敲，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战案例来学习。

在这里插入图片描述
本文介绍了pandas常用的35个基础操作。包括数据筛选、修改、删除、分组、合并、连接、透视表等。通过这些操作，我们可以对数据处理分析。在实际应用中，我们可以根据需要选择合适的操作来满足我们
的需求。
如有侵权，请联系删除。

宇宙大豹发

关注

9
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Pandas常用的35个经典操作

pandas是Python最常用的数据处理库之一，本文介绍其最常用的基础操作。首先我们需要导入pandas库，并创建一个DataFrame。
复制链接

扫一扫