python每行乘列表_python – 在pandas数据帧中查找每行的两列列表中哪一列的最快方法...

最新推荐文章于 2021-02-20 04:10:58 发布

weixin_39940154

最新推荐文章于 2021-02-20 04:10:58 发布

阅读量70

点赞数

文章标签： python每行乘列表

我正在寻找最快的方法来做到以下几点：

我们有一个pd.DataFrame：

df = pd.DataFrame({

'High': [1.3,1.2,1.1],

'Low': [1.3,1.2,1.1],

'High1': [1.1, 1.1, 1.1],

'High2': [1.2, 1.2, 1.2],

'High3': [1.3, 1.3, 1.3],

'Low1': [1.3, 1.3, 1.3],

'Low2': [1.2, 1.2, 1.2],

'Low3': [1.1, 1.1, 1.1]})

看起来像：

In [4]: df

Out[4]:

High High1 High2 High3 Low Low1 Low2 Low3

0 1.3 1.1 1.2 1.3 1.3 1.3 1.2 1.1

1 1.2 1.1 1.2 1.3 1.2 1.3 1.2 1.1

2 1.1 1.1 1.2 1.3 1.1 1.3 1.2 1.1

我想知道的是High1,High2,High3浮点值中的哪一个是大于或等于High值的第一个.如果没有,那应该是np.nan

对于Low1,Low2,Low3值也是如此,但在这种情况下,其中一个是第一个低于或等于High值的值.如果没有,那应该是np.nan

最后,我需要知道哪一个,低或高是第一个.

解决这个问题的一种方法是以一种奇怪而不太高效的方式：

df['LowIs'] = np.nan

df['HighIs'] = np.nan

for i in range(1,4):

df['LowIs'] = np.where((np.isnan(df['LowIs'])) & (

df['Low'] >= df['Low'+str(i)]), i, df['LowIs'])

df['HighIs'] = np.where((np.isnan(df['HighIs'])) & (

df['High'] <= df['High'+str(i)]), i, df['HighIs'])

df['IsFirst'] = np.where(

df.LowIs < df.HighIs,

'Low',

np.where(df.LowIs > df.HighIs, 'High', 'None')

)

这给了我：

In [8]: df

Out[8]:

High High1 High2 High3 Low Low1 Low2 Low3 LowIs HighIs IsFirst

0 1.3 1.1 1.2 1.3 1.3 1.3 1.2 1.1 1.0 3.0 Low

1 1.2 1.1 1.2 1.3 1.2 1.3 1.2 1.1 2.0 2.0 None

2 1.1 1.1 1.2 1.3 1.1 1.3 1.2 1.1 3.0 1.0 High

由于我必须在高/低不同的多次迭代中反复这样做,因此执行此操作时的性能至关重要.

所以我不介意High1,High2,High3和Low1,Low2,Low3是否会在一个单独的DataFrame中进行转置,或者它是否在dict或其他任何内容中.因此,在任何能够提供最佳性能的情况下准备数据的过程可能会变得缓慢而笨拙.

我工作的一个解决方案,但是无法完成以矢量化方式工作,而且似乎也很慢：

df.loc[(df.index == 0), 'HighIs'] = np.where(

df.loc[(df.index == 0), ['High1', 'High2', 'High3']] >= 1.3

)[1][0] + 1

因此,检查第一行中哪一列是真的,然后查看np.where()的索引号.

期待任何建议,并希望学到新的东西！ 🙂

weixin_39940154

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。