pandas频繁性操作总结

本文总结了pandas库中数据的常见操作,包括查询数据的多种方式,如查看前n行、后n行、特定列和使用iloc/loc索引;修改数据,如replace函数的用法,以及如何通过字典传入更改值;删除数据,利用drop函数的参数控制;以及增加数据,包括行和列的插入方法。
摘要由CSDN通过智能技术生成

文章目录


pandas是python中经常使用的一个库,使用得最多的就是读取文件后的datafram对象,然后其他的操作基本上就是使用一次查询一次用法…,因此记录下最常见的一些操作方法.按照使用频率分为:查,改,删,增四个方面.

测试的数据文档表格如下:

a b c d
1 2 3
4 5 6
7 8 9 s
11 22 33
44 55 66 d
77 88 99
import pandas as pd
df = pd.readcsv('test_data.csv')

  • 展示数据前n行(默认是5行)
df.head(n)
  • 展示数据后n行(默认是5行)
df.tail(n)
  • 得到指定列名(列标签)的列数据
# 这是得到a和b列的所有数据,多列必须包装成一个列表
df[['a', 'b']]
# 获取某一列的数据,这个可以不用传入一个列表索引
df['a']
  • 使用iloc进行索引取值

    iloc即index locate 索引定位,根据行索引和列索引进行数据的查找,其基本格式为:

    df.iloc[行索引的列表/切片表示, 列索引的列表/切片表示 ]
    
# 切片表示,得到所有行和所有列
df.iloc[:, :]
# 列表表示,得到所有行和所有列
df.iloc[[0,1,2,3,4,5, ], [0,1,2,3,]]
# 通过上述索引方法即可得到dataframe对象任意一块区域的数据表示
  • 使用loc进行取值

    loc即根据label名称进行取值,同上述的iloc一样,传入要得到需要的字段即可.其基本格式如下:

    df.iloc[行标签的列表, 列标签的列表]
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值