python 相同数据加序号

最新推荐文章于 2023-05-26 10:17:45 发布

风少年~

最新推荐文章于 2023-05-26 10:17:45 发布

阅读量1.8k

点赞数 3

分类专栏： demo Python学一点

本文链接：https://blog.csdn.net/albg_boy/article/details/108080150

版权

demo 同时被 2 个专栏收录

36 篇文章 0 订阅

订阅专栏

Python学一点

17 篇文章 3 订阅

订阅专栏

官网参考：https://pandas.pydata.org/pandas-docs/version/0.15.0/generated/pandas.core.groupby.GroupBy.cumcount.html

import pandas as pd
train_data = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\20200818.txt', sep='\t',encoding='utf-8',index_col=0,header=0)
train_data.drop_duplicates(inplace=True)
df = pd.DataFrame(train_data)
# grouped = df.groupby(['通话id'])
df['id']=df.groupby(['通话id']).cumcount()+1
# grouped = grouped.sort_values(['label'], ascending=True)
#
print(df.head(10))
df.to_csv('E:\\tmp\\2\\202008182_2.txt',
                  sep='\t',
                  encoding='utf-8',
                  header=None)