python每行乘列表_python – 在pandas数据帧中查找每行的两列列表中哪一列的最快方法...

我正在寻找最快的方法来做到以下几点:

我们有一个pd.DataFrame:

df = pd.DataFrame({

'High': [1.3,1.2,1.1],

'Low': [1.3,1.2,1.1],

'High1': [1.1, 1.1, 1.1],

'High2': [1.2, 1.2, 1.2],

'High3': [1.3, 1.3, 1.3],

'Low1': [1.3, 1.3, 1.3],

'Low2': [1.2, 1.2, 1.2],

'Low3': [1.1, 1.1, 1.1]})

看起来像:

In [4]: df

Out[4]:

High High1 High2 High3 Low Low1 Low2 Low3

0 1.3 1.1 1.2 1.3 1.3 1.3 1.2 1.1

1 1.2 1.1 1.2 1.3 1.2 1.3 1.2 1.1

2 1.1 1.1 1.2 1.3 1.1 1.3 1.2 1.1

我想知道的是High1,High2,High3浮点值中的哪一个是大于或等于High值的第一个.如果没有,那应该是np.nan

对于Low1,Low2,Low3值也是如此,但在这种情况下,其中一个是第一个低于或等于High值的值.如果没有,那应该是np.nan

最后,我需要知道哪一个,低或高是第一个.

解决这个问题的一种方法是以一种奇怪而不太高效的方式:

df['LowIs'] = np.nan

df['HighIs'] = np.nan

for i in range(1,4):

df['LowIs'] = np.where((np.isnan(df['LowIs'])) & (

df['Low'] >= df['Low'+str(i)]), i, df['LowIs'])

df['HighIs'] = np.where((np.isnan(df['HighIs'])) & (

df['High'] <= df['High'+str(i)]), i, df['HighIs'])

df['IsFirst'] = np.where(

df.LowIs < df.HighIs,

'Low',

np.where(df.LowIs > df.HighIs, 'High', 'None')

)

这给了我:

In [8]: df

Out[8]:

High High1 High2 High3 Low Low1 Low2 Low3 LowIs HighIs IsFirst

0 1.3 1.1 1.2 1.3 1.3 1.3 1.2 1.1 1.0 3.0 Low

1 1.2 1.1 1.2 1.3 1.2 1.3 1.2 1.1 2.0 2.0 None

2 1.1 1.1 1.2 1.3 1.1 1.3 1.2 1.1 3.0 1.0 High

由于我必须在高/低不同的多次迭代中反复这样做,因此执行此操作时的性能至关重要.

所以我不介意High1,High2,High3和Low1,Low2,Low3是否会在一个单独的DataFrame中进行转置,或者它是否在dict或其他任何内容中.因此,在任何能够提供最佳性能的情况下准备数据的过程可能会变得缓慢而笨拙.

我工作的一个解决方案,但是无法完成以矢量化方式工作,而且似乎也很慢:

df.loc[(df.index == 0), 'HighIs'] = np.where(

df.loc[(df.index == 0), ['High1', 'High2', 'High3']] >= 1.3

)[1][0] + 1

因此,检查第一行中哪一列是真的,然后查看np.where()的索引号.

期待任何建议,并希望学到新的东西! 🙂

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值