Pandas查询数据的几种方法
-
df.loc方法,根据行、列的标签值查询
-
df.iloc方法,根据行、列的数字位置查询
-
df.where方法
-
df.quey方法
使用df.loc既能查询,又能装盖写入,强烈推荐!
#Pandas使用df.loc查询数据的方法
-
使用单个label值查询数据
import pandas as pd df = pd.read_csv("./ml-latest-small/ratings.csv") print(df["userId"]) print(df.loc[:, "userId"]) print(df.loc[10, "userId"]) print(df.loc[10, :])
-
使用值列表批量查询
print(df.loc[:, ["userId", "movieId"]])
-
使用数值区间进行范围查询
print(df.loc[:, "movieId":"timestamp"]) print(df.loc[50:100:2, "movieId":"timestamp"])
-
使用条件表达式查询
print(df.loc[df["rating"] > 3.0, :]) print(df.loc[(df["rating"] > 3.0) & (df["rating"] < 4.0), :]) # &或者|逻辑符连接多个条件
-
调用函数查询
def fun(d: df, f: float, s: str): d1 = d[s] > f return d1 var = df.loc[fun(df, 3.5, "rating"), :] print(var)
#注意
-
以上查询方法,既适用于行,也适用于列
-
注意观察降维dataFrame>Series>值