pandas频繁性操作总结

最新推荐文章于 2024-04-27 05:59:31 发布

123liudong

最新推荐文章于 2024-04-27 05:59:31 发布

阅读量320

点赞数

分类专栏：工具数据分析

本文链接：https://blog.csdn.net/qq_38727626/article/details/105043600

版权

本文总结了pandas库中数据的常见操作，包括查询数据的多种方式，如查看前n行、后n行、特定列和使用iloc/loc索引；修改数据，如replace函数的用法，以及如何通过字典传入更改值；删除数据，利用drop函数的参数控制；以及增加数据，包括行和列的插入方法。

摘要由CSDN通过智能技术生成

pandas是python中经常使用的一个库,使用得最多的就是读取文件后的datafram对象,然后其他的操作基本上就是使用一次查询一次用法…,因此记录下最常见的一些操作方法.按照使用频率分为:查,改,删,增四个方面.

测试的数据文档表格如下:

import pandas as pd
df = pd.readcsv('test_data.csv')

df.head(n)

df.tail(n)

# 这是得到a和b列的所有数据,多列必须包装成一个列表
df[['a', 'b']]
# 获取某一列的数据,这个可以不用传入一个列表索引
df['a']

使用iloc进行索引取值
iloc即index locate 索引定位,根据行索引和列索引进行数据的查找,其基本格式为:
```
df.iloc[行索引的列表/切片表示, 列索引的列表/切片表示 ]
```

# 切片表示,得到所有行和所有列
df.iloc[:, :]
# 列表表示,得到所有行和所有列
df.iloc[[0,1,2,3,4,5, ], [0,1,2,3,]]
# 通过上述索引方法即可得到dataframe对象任意一块区域的数据表示

使用loc进行取值
loc即根据label名称进行取值,同上述的iloc一样,传入要得到需要的字段即可.其基本格式如下:
```
df.iloc[行标签的列表, 列标签的列表]
```

关注

专栏目录