dataframe是pandas包的重要对象,熟练掌握dataframe的基本操作是很有必要的。
下面就总结一下dataframe取行列元素的基本操作。
一. DataFrame的基本结构
可以理解为一个矩阵,所有的行名保存在index, 列名保存在columns(注意:一个是单数,一个是复数)。写程序的时候不仅要调用pandas (import pandas as pd), 还要记得调用numpy这个包:(import numpy as np),pandas不默认包含numpy。
构建一个3×3的dataframe如下:
df = pd.DataFrame(np.arange(9).reshape(3, 3), index = ['row1', 'row2', 'row3'], columns=['col1', 'col2','col3'])
例子里面行名df.index=Index(['row1','row2','row3'],dtype='object')
以及df.columns=Index(['col1','col2','col3'],dtype='object')。(Index对象用来保存标签数据)。
二. 按索引或行列名选取DataFrame的行和列的方法
1)用列名取一列 (不推荐)
df['col1']即取得第一列,是一个Series对象。
注意:用df['row1'],df[0],df[:,0],