Pandas常用的35个经典操作

pandas是Python最常用的数据处理库之一,本文介绍其最常用的基础操作。

在这里插入图片描述

首先我们需要导入pandas库,并创建一个DataFrame。这里我们使用字典来创建一个简单的DataFrame:

import pandas as pd

data = {
    '姓名': ['张三', '李四', '王五', '赵六'],
    '年龄': [25, 30, 35, 40],
    '性别': ['男', '女', '男', '女']
}

df = pd.DataFrame(data)

接下来,我们将介绍pandas常用的35个经典操作:

  1. 查看数据前5行:
print(df.head())   
  1. 查看数据信息(如数据类型、非空值数量等):
print(df.info())   
  1. 查看数据描述性统计信息(如均值、标准差等):
print(df.describe())   
  1. 查看数据列名:
print(df.columns)   
  1. 查看数据索引:
print(df.index)   
  1. 按列名选择数据:
print(df['姓名'])   
  1. 按列名修改数据:
df['姓名'] = ['张三丰', '李四光', '王五岳', '赵六令']   
print(df)   
  1. 按条件筛选数据:
filtered_df = df[df['年龄'] > 30]   
print(filtered_df)   
  1. 按条件修改数据:
df.loc[df['年龄'] > 30, '年龄'] = 31  
print(df)   
  1. 按条件删除数据:
df = df[df['年龄'] != 31]   
print(df)   
  1. 添加新列:
df['城市'] = ['北京', '上海', '广州', '深圳']   
print(df)   
  1. 删除列:
df = df.drop('城市', axis=1)   
print(df)   
  1. 重命名列:
df = df.rename(columns={'姓名': '名字'})  
print(df)   
  1. 设置索引:
df = df.set_index('名字')   
print(df)   
  1. 重置索引:
df = df.reset_index()   
print(df)   
  1. 排序:
sorted_df = df.sort_values(by='年龄')   
print(sorted_df)   
  1. 分组:
grouped_df = df.groupby('性别')   
print(grouped_df.mean())   
  1. 合并:
data2 = {'名字': ['孙悟空', '猪八戒'], '年龄': [500, 400], '性别': ['男', '男']}
df2 = pd.DataFrame(data2)
merged_df = pd.concat([df, df2])
print(merged_df)
  1. 插入数据:
df.loc[1.5] = ['唐僧', 25, '男']   
print(df)   
  1. 删除数据:
df = df.drop([1, 2])   
print(df)   
  1. 填充缺失值:
df['年龄'] = df['年龄'].fillna(30)   
print(df)   
  1. 去除重复值:
df = df.drop_duplicates()   
print(df)   
  1. 数据透视表:
pivot_table = pd.pivot_table(df, values='年龄', index='名字', columns='性别')   
print(pivot_table)   
  1. 数据转置:
transposed_df = df.T   
print(transposed_df)   
  1. 数据合并(按行):
df3 = pd.DataFrame({'名字': ['白龙马'], '年龄': [300], '性别': ['男']})
merged_df = pd.merge(df, df3, on='名字')
print(merged_df)
  1. 数据合并(按列):
merged_df = pd.merge(df, df3, left_index=True, right_index=True)   
print(merged_df)   
  1. 数据连接(按行):
connected_df = pd.concat([df, df3])  
print(connected_df)   
  1. 数据连接(按列):
connected_df = pd.concat([df, df3], axis=1)   
print(connected_df)   
  1. 数据切片:
sliced_df = df[1:3]   
print(sliced_df)   
  1. 数据迭代:
for index, row in df.iterrows():       
print(row)   
  1. 数据过滤:
filtered_df = df[(df['年龄'] > 25) & (df['性别'] == '男')]   
print(filtered_df)   
  1. 数据替换:
df['性别'] = df['性别'].replace('男', 'M')   
print(df)   
  1. 数据映射:
mapping = {'男': 'M', '女': 'F'}   df['性别'] = df['性别'].map(mapping)   
print(df)   
  1. 数据透视表(多重索引):
pivot_table = pd.pivot_table(df, values='年龄', index=['名字', '性别'])   print(pivot_table)   
  1. 数据透视表(聚合函数):
pivot_table = pd.pivot_table(df, values='年龄', index='名字', columns='性别', aggfunc='mean')   
print(pivot_table)   

关于python技术储备:

由于文章篇幅有限,文档资料内容较多,需要这些文档的朋友,可以加小助手微信免费获取,【保证100%免费】,中国人不骗中国人。

在这里插入图片描述

                                     **(扫码立即免费领取)**

全套Python学习资料分享:

一、Python所有方向的学习路线

Python所有方向路线就是把Python常用的技术点做整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。

二、学习软件

工欲善其事必先利其器。学习Python常用的开发软件都在这里了,还有环境配置的教程,给大家节省了很多时间。

三、全套PDF电子书

书籍的好处就在于权威和体系健全,刚开始学习的时候你可以只看视频或者听某个人讲课,但等你学完之后,你觉得你掌握了,这时候建议还是得去看一下书籍,看权威技术书籍也是每个程序员必经之路。

四、入门学习视频全套

我们在看视频学习的时候,不能光动眼动脑不动手,比较科学的学习方法是在理解之后运用它们,这时候练手项目就很适合了。

五、实战案例

光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。


在这里插入图片描述
本文介绍了pandas常用的35个基础操作。包括数据筛选、修改、删除、分组、合并、连接、透视表等。通过这些操作,我们可以对数据处理分析。在实际应用中,我们可以根据需要选择合适的操作来满足我们
的需求。
如有侵权,请联系删除。

  • 9
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值