python pandas 分组后列上移

最新推荐文章于 2022-07-29 16:54:38 发布

风少年~

最新推荐文章于 2022-07-29 16:54:38 发布

阅读量742

点赞数

分类专栏： Python学一点 demo

本文链接：https://blog.csdn.net/albg_boy/article/details/108083194

版权

demo 同时被 2 个专栏收录

36 篇文章 0 订阅

订阅专栏

Python学一点

17 篇文章 3 订阅

订阅专栏

import pandas as pd
train_data = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\xuhao', sep='\t',encoding='utf-8',names=['id','xuhao', 'txt'])
# train_data.drop_duplicates(inplace=True)
df = pd.DataFrame(train_data)
df['new_data'] = df.groupby('id')['txt'].shift(-1)
# grouped['newxuhao']= grouped.groupby(['id']).cumcount()+1
# grouped = grouped.sort_values(['label'], ascending=True)
#
print(df.head(10))
df.to_csv('E:\\tmp\\2\\202008182_3.txt',
                  sep='\t',
                  encoding='utf-8',
                  header=None)

id xuhao txt new_data
0 104 1 start 嗯
1 104 2 嗯嗯
2 104 3 嗯 NaN
3 181 1 start 嗯是的
4 181 2 嗯是的好的，好的嗯
5 181 3 好的，好的嗯 NaN
6 158 1 start 那是
7 158 2 那是呃我是
8 158 3 呃我是嗯，那我我我我，我能
9 158 4 嗯，那我我我我，我能 NaN

优惠劵

风少年~

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python pandas 分组后列上移

import pandas as pdtrain_data = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\xuhao', sep='\t',encoding='utf-8',names=['id','xuhao', 'txt'])# train_data.drop_duplicates(inplace=True)df = pd.DataFrame(train_data)df['new_data'] = df.groupby('id')['txt'].s.
复制链接

扫一扫