对于excel表格操作,有以下几种常用的操作:
- 选择指定的元素
- 选择满足特定条件的元素
- 排序和数据的运算
- 行列的删减和合并
这些需求基于可以用标签或者坐标的方式,正确指向相应的行、列或者是某个区域。这种能力称为索引indexing、切片slicing。这一部分主要介绍如何访问特定的行、列、以及表格中连续或者规则的区域。如何选择满足特定条件的区域将在后面介绍。
pandas对于DataFrame的操作继承了Numpy中数组的操作方式,如果对于Numpy很熟悉,基本上是大同小异。主要的区别在于pandas中多了标签的概念。假设是下方的DataFrame,我们来看如何访问规则的区域。
访问行和列
使用列标签提取某列元素,如下图所示, 提取了所有人的“职业”。这里需要注意的是提取出的列的类型为Series。
如果在此列中,需要特定指出特定行的元素,就可以直接用数字指标标示出行,如下。