0. DataFrame
DataFrame 的构造主要依赖如下三个参数:
- data:表格数据;
- index:行索引;
- columns:列名;
- index 对行进行索引,columns 对列进行索引;
>> import pandas as pd >> data = [[1,2,3],[4,5,6]] >> index = [0,1] >> columns=['a','b','c'] >> df = pd.DataFrame(data=data, index=index, columns=columns) >> df a b c 0 1 2 3 1 4 5 6
1. loc
loc 通过行索引(index)获取行:
>> df.loc[1] a 4 b 5 c 6
如果 DataFrame 在构造时,索引不是整数而是字符:
index = ['d','e'] columns=['a','b','c'] df = pd.DataFrame(data=data, index=index, columns=columns) >> df.loc['d']
索引某列:
>> df.loc['d', ['b', 'c']] >> df.loc[:, ['c']]
2. iloc
同 loc 不同,iloc 则是通过行号对行进行索引,通过行索引则会报错:
- df.iloc[0:] :索引全部行;
- df.iloc[:, [1]] :索引第一列
3. df.values ⇒ ndarray
>> df.values
array([[1, 2, 3],
[4, 5, 6]], dtype=int64)