在刚开始使用pandas DataFrame的时候,对于数据的选取,修改和切片经常困惑,这里总结了一些常用的操作。
pandas主要提供了三种属性用来选取行/列数据:
属性名
属性
ix
根据整数索引或者行标签选取数据
iloc
根据位置的整数索引选取数据
loc
根据行标签选取数据
先初始化一个DateFrame做例子
import numpy as np
import pandas as pd
df = pd.DataFrame([['Snow','M',22],['Tyrion','M',32],['Sansa','F',18],['Arya','F',14]], columns=['name','gender','age'])
df是这样的
In [35]: df
Out[35]:
name gender age
0 Snow M 22
1 Tyrion M 32
2 Sansa F 18
3 Arya F 14
如果每列都有column name,比如这里是:
In [42]: df.columns
Out[42]: Index(['name', 'gender', 'age'], dtype='object')
1. df['column_name'] ,df[row_start_ind