假设数据集data_101如下:
content source_id max_similar
0 东篱 1 1.0
1 东篱 2 1.0
2 在么 3 1.0
3 在么 4 1.0
4 快回我 5 1.0
5 快回我 6 1.0
按content 分组,标记
实现 row_number() 功能
data1_101['row_number']=data1_101.groupby(data1_101['content'])['max_similar'].rank(ascending=True,method='first')
content source_id max_similar row_number
0 东篱 1 1.0 1.0
1 东篱 2 1.0 2.0
2 在么 3 1.0 1.0
3 在么 4 1.0 2.0
4 快回我 5 1.0 1.0
5 快回我 6 1.0 2.0