python pandas 增加一列_在Python Pandas Dataframe中动态添加列的数据处理

最新推荐文章于 2024-03-22 20:16:17 发布

家有萌小主

最新推荐文章于 2024-03-22 20:16:17 发布

阅读量2k

点赞数

文章标签： python pandas 增加一列

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42548888/article/details/112842814

版权

本文探讨了一个Python Pandas数据处理的问题，涉及如何根据ID分组数据并在DataFrame中新增列。作者分享了一个解决方案，但表示该方法运行缓慢，并寻求加快速度的方法。解决方案包括读取CSV文件，按ID分组，选择特定行并转换为列，最后将结果写入新的CSV文件。示例代码展示了如何处理大约700,000行和70,000个ID组的数据。" 110209751,10293771,Vue源码解析：数据代理与数组操作,"['vue框架', 'es5特性', '数据处理', '前端开发', 'JavaScript']

摘要由CSDN通过智能技术生成

我有以下问题.

可以说这是我的CSV

id f1 f2 f3

1 4 5 5

1 3 1 0

1 7 4 4

1 4 3 1

1 1 4 6

2 2 6 0

..........

因此,我有可以按ID分组的行.

我想创建如下的csv作为输出.

f1 f2 f3 f1_n f2_n f3_n f1_n_n f2_n_n f3_n_n f1_t f2_t f3_t

4 5 5 3 1 0 7 4 4 1 4 6

因此,我希望能够选择要转换为列的行数(始终从id的第一行开始).在这种情况下,我抓了3行.

然后,我还将跳过一个或多个行(在这种情况下,仅跳过一个),以从同一id组的最后一行获取最后一列.由于某些原因,我想使用一个数据框.

经过3-4个小时的奋斗.我找到了下面给出的解决方案.

但是我的解决方案很慢.我大约有700,000行,可能有大约70,000组ID.在我的4GB 4核心Lenovo上,model = 3上的上述代码将花费近一个小时.我需要进入模型=可能是10或15.我仍然是Python的新手,并且我相信可以进行一些更改来加快速度.有人可以深入解释我如何改进代码.

万分感谢.

型号：要抓取的行数

# train data frame from reading the csv

train = pd.read_csv(filename)

# Get groups of rows with same id

csv_by_id = train.groupby('id')

modelTarget = { 'f1_t','f2_t','f3_t'}

# modelFeatures is a list of features I am interested in the csv.

# The csv actually has hundreds

modelFeatures = { 'f1, 'f2' , 'f3' }

coreFeatures = list(modelFeatures) # cloning

selectedFeatures = list(modelFeatures) # cloning

newFeatures = list(selectedFeatures) # cloning

finalFeatures = list(selectedFeatures) # cloning

#

最低0.47元/天解锁文章

家有萌小主

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python pandas 增加一列_在Python Pandas Dataframe中动态添加列的数据处理

我有以下问题.可以说这是我的CSVid f1 f2 f31 4 5 51 3 1 01 7 4 41 4 3 11 1 4 62 2 6 0..........因此,我有可以按ID分组的行.我想创建如下的csv作为输出.f1 f2 f3 f1_n f2_n f3_n f1_n_n f2_n_n f3_n_n f1_t f2_t f3_t4 5 5 3 ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。