访问元素和提取子集是数据框的基本操作,在pandas中,提供了多种方式。对于一个数据框而言,既有从0开始的整数下标索引,也有行列的标签索引>>> df = pd.DataFrame(np.random.randn(4, 4), index=['r1', 'r2', 'r3', 'r4'], columns=['A', 'B', 'C', 'D'])>>> df A B C Dr1 -0.220018 -0.398571 0.109313 0.186309r2 -1.416611 0.826713 0.178174 0.117015r3 -0.640207 -0.105941 -0.139368 -1.159992r4 -2.254314 -1.228511 -2.080118 -0.212526利用这两种索引,可以灵活的访问数据框中的元素,具体的操作方式有以下几种
1. 属性运算符
数据框的每一列是一个Series对象,属性操作符的本质是先根据列标签得到对应的Series对象,再根据Series对象的标签来访问其中的元素,用法如下# 第一步,列标签作为属性,先得到Series对象>>> s = df.A>>> sr1 -0.220018r2 -1.416611r3 -0.640207r4 -2.254314Name: A, dtype: float64# 第二步,在根据下标或者标签访问Series对象中的元素>>> s.r1-0.22001819046457136>>> s[0]-0.22001819046457136# 属性操作符,一步法简写如下>>> df.A.r1-0.2200