【demo】python 按照标签分组取前N行

最新推荐文章于 2023-02-04 22:32:30 发布

风少年~

最新推荐文章于 2023-02-04 22:32:30 发布

阅读量484

点赞数

分类专栏： Python学一点 demo

本文链接：https://blog.csdn.net/albg_boy/article/details/108076628

版权

demo 同时被 2 个专栏收录

36 篇文章 0 订阅

订阅专栏

Python学一点

17 篇文章 3 订阅

订阅专栏

import pandas as pd
train_data = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\tagging.tsv', sep='\t',encoding='utf-8',index_col=0,header=None,
                         names=["label", "textA", "textB"])
train_data.drop_duplicates(inplace=True)
df = pd.DataFrame(train_data)
grouped = df.groupby(['label']).head(3000)
grouped = grouped.sort_values(['label'], ascending=True)
#
print(grouped)
grouped.to_csv('E:\\tmp\\2\\tagging2.tsv',
                  sep='\t',
                  encoding='utf-8',
                  header=None)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

风少年~

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【demo】python 按照标签分组取前N行

import pandas as pdtrain_data = pd.read_csv(filepath_or_buffer='E:\\tmp\\2\\tagging.tsv', sep='\t',encoding='utf-8',index_col=0,header=None, names=["label", "textA", "textB"])train_data.drop_duplicates(inplace=True)df = pd.Data.
复制链接

扫一扫