df.columns = ['col1','col2','col3','col4','col5']#修改列名 print(df)
输入文件:
col1 col2 col3 col4 col5
0 chr1 23249349 23251066 REVERSE LENGTH=237\n
1 chr1 819712 821227 FORWARD LENGTH=385\n
2 chr1 25508737 25510697 FORWARD LENGTH=619\n
3 chr1 27110887 27111825 FORWARD LENGTH=256\n
4 chr1 1202815 1205664 FORWARD LENGTH=468\n
希望取出python某列相等,另一列的最大值的那一行:
df_groupby_0 = df.groupby('col1', as_index=False)["col3"].max()
print(df_groupby_0)
这明显不是最大的那一行啊
col1 col3
0 chr1 9994642
1 chr2 9998945
2 chr3 9999892
3 chr4 9994099
4 chr5 9992770
5 chrc 98793
然后又百度了另一种:
df_groupby_1 = df.sort_values('col3', ascending=False).groupby('col1', as_index=False).first()#ascending正序还是倒序
哇,没有区别呢。。。
啊啊啊,剪秋,我不懂啊?