分层索引
# 单层分层
df.groupby([索引])
# 多层分层
df.groupby([索引1,索引2,索引3,...])
# 将第二个索引变成列
df.unstack()
# 将索引恢复
df.reset_index()
# 设置索引
df.set_index([一级索引,二级索引])
# ================================
# DataFrame筛选
df.loc[一级索引] # 单个索引
df.loc[(一级索引,二级索引)] # 多个索引
# 多个一级索引中的多个二级索引
df.loc[([一级索引1,一级索引2],[二级索引1,二级索引2])] # 同一个列表里的是同级索引的多个值 元组内容是多级索引
转换函数
# ===================Series========================
# 方法一: Series.map(dict)
df["字段"] = df["字段"].map(字典) # 根据字典内容替换相应内容
# 方法二 Series.map(func)
df["字段"] = df["字段"].map(lambda x:实现) # 根据函数实现替换内容
# 方法三 Series.apply(函数)
df["字段"] = df["字段"].apply(lambda x:实现)
#===================DataFrame======================
# 方法一 DataFrame.apply()
df["字段"] = df.apply(
lambda x:实现,
axis = 1 # 行轴
)
# 方法二 DataFrame.applymap()
df.applymap(lambda x:实现)