# 选择col列的值大于0.5的行
df[df[col] > 0.5]:
# 按照列col1排序数据,默认升序排列
df.sort_values(col1):
# 按照列col1降序排列数据
df.sort_values(col2, ascending=False):
# 先按列col1升序排列,后按col2降序排列数据
df.sort_values([col1,col2], ascending=[True,False]):
# 返回一个按列col进行分组的Groupby对象
df.groupby(col):
# 返回一个按多列进行分组的Groupby对象
df.groupby([col1,col2]):
# 返回按列col1进行分组后,列col2的均值
df.groupby(col1)[col2]:
# 创建一个按列col1进行分组,并计算col2和col3的最大值的数据透视表
df.pivot_table(index=col1, values=[col2,col3], aggfunc=max):
# 返回按列col1分组的所有列的均值
df.groupby(col1).agg(np.mean):
# 对DataFrame中的每一列应用函数np.mean
data.apply(np.mean):
# 对DataFrame中的每一行应用函数np.max
data.apply(np.max,axis=1):
pandas中数据的处理
最新推荐文章于 2021-11-13 13:52:23 发布