pandas是python中经常使用的一个库,使用得最多的就是读取文件后的datafram对象,然后其他的操作基本上就是使用一次查询一次用法…,因此记录下最常见的一些操作方法.按照使用频率分为:查,改,删,增四个方面.
测试的数据文档表格如下:
a | b | c | d |
---|---|---|---|
1 | 2 | 3 | 啊 |
4 | 5 | 6 | |
7 | 8 | 9 | s |
11 | 22 | 33 | |
44 | 55 | 66 | d |
77 | 88 | 99 |
import pandas as pd
df = pd.readcsv('test_data.csv')
查
- 展示数据前n行(默认是5行)
df.head(n)
- 展示数据后n行(默认是5行)
df.tail(n)
- 得到指定列名(列标签)的列数据
# 这是得到a和b列的所有数据,多列必须包装成一个列表
df[['a', 'b']]
# 获取某一列的数据,这个可以不用传入一个列表索引
df['a']
-
使用iloc进行索引取值
iloc即index locate 索引定位,根据行索引和列索引进行数据的查找,其基本格式为:
df.iloc[行索引的列表/切片表示, 列索引的列表/切片表示 ]
# 切片表示,得到所有行和所有列
df.iloc[:, :]
# 列表表示,得到所有行和所有列
df.iloc[[0,1,2,3,4,5, ], [0,1,2,3,]]
# 通过上述索引方法即可得到dataframe对象任意一块区域的数据表示
-
使用loc进行取值
loc即根据label名称进行取值,同上述的iloc一样,传入要得到需要的字段即可.其基本格式如下:
df.iloc[行标签的列表, 列标签的列表]