python怎么选取不连续的列_如何从列表中选择多个非连续列到python中的另一个数据帧...

最新推荐文章于 2023-04-04 15:48:31 发布

左飞Jacky

最新推荐文章于 2023-04-04 15:48:31 发布

阅读量1.6k

点赞数 1

文章标签： python怎么选取不连续的列

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33404792/article/details/113669927

版权

我正在研究I

python和Spark,我有一个RDD,我从中形成一个列表.现在从这个列表中我想形成一个数据框,它有父列表中的多列但这些列不是连续的.我写了这个,但似乎工作错了：

list1 = rdd.collect()

columns_num = [1,8,11,17,21,24]

df2 = [list[i] for i in columns_num]

上面的代码只从父列表中选择6行,只有第1列数据,并形成具有这6列1数据的新数据帧.

如何从另一个列表中创建具有多个不连续列的新数据框

例如这样：

rdd = sc.parallelize([("a", 1, 2, 4.0, "foo"), ("b", 3, 4, 5.0, "bar")])

columns_num = [0, 3]

df = rdd.toDF()

df2 = df.select(*(df.columns[i] for i in columns_num))

df2.show()

## +---+---+

## | _1| _4|

## +---+---+

## | a|4.0|

## | b|5.0|

## +---+---+

或者像这样：

df = rdd.map(lambda row: [row[i] for i in columns_num]).toDF()

df.show()

## +---+---+

## | _1| _4|

## +---+---+

## | a|4.0|

## | b|5.0|

## +---+---+

在一方面,你不应该只是为了重塑收集数据.在最好的情况下它会很慢,在最坏的情况下它会崩溃.

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python怎么选取不连续的列_如何从列表中选择多个非连续列到python中的另一个数据帧...

我正在研究Ipython和Spark,我有一个RDD,我从中形成一个列表.现在从这个列表中我想形成一个数据框,它有父列表中的多列但这些列不是连续的.我写了这个,但似乎工作错了：list1 = rdd.collect()columns_num = [1,8,11,17,21,24]df2 = [list[i] for i in columns_num]上面的代码只从父列表中选择6行,只有第1列数据,...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。