pandas关键数据结构
对程序员来说,如何快速掌握代码库的使用方法很重要,很多工程师只是对经常使用的三方库熟悉,随着项目的变更第三方库也会跟着变化。时间久了,刚开始熟悉的第三方库也会变的陌生。如何加深记忆,在需要时快速回想起来,就必须从第三方库的源码数据结构,架构方面去了解它。
因此要熟练使用pandas库,本文从pandas代码库的基本数据结构着手。
基本数据结构dataframe
构造dataframe对象:
df = pd.DataFrame()
下面我们看看DataFrame类中包含哪些属性和方法
print(dir(df))
可以看到里面axes, shape等方法都被装饰器property装饰,可以像调用属性来使用方法
@property
def axes(self):
return [self.index, self.columns]
@property
def shape(self):
return len(self.index), len(self.columns)
所以我们可以知道在使用过程中,对于axes, shape该不该加括号。
基本数据结构series
构造series对象:
df_series = pd.Series()
@property
def axes(self):
"""
Return a list of the row axis labels.
"""
return [self.index]
在这里我们可以看到,series对象中没有shape,只有axes属性