pandas
的数据检索功能是其最基础也是最重要的功能之一。
pandas
中最常用的几种数据过滤方式如下:
- 行列过滤:选取指定的行或者列
- 条件过滤:对列的数据设置过滤条件
- 函数过滤:通过函数设置更加复杂的过滤条件
本篇所有示例所使用的测试数据如下:
import pandas as pd
import numpy as np
fp = "http://databook.top:8888/pandas/cn-people.csv"
df = pd.read_csv(fp)
df
1. 行列过滤
pandas
中最常用的按行或者按列选择数据的函数是 loc
和 iloc
。
1.1 loc 函数
loc
函数通过标签索引选择行列数据,可以在一个语句中同时指定行和列的条件。
按范围选取行:
df.loc([1:5, :])
选取指定的行:
df.loc[[1, 5], :]
按范围选取列:
df.loc[:, "年份":"指标中文"]
选取指定的列:
df.loc[:,