pandas: 根据一列的条件来替换另一列的值

问题

自己处理数据的时候遇到的问题

dataframe是这样的

df.head(10)
7   RT (min)    Area (Ab*s) Quality patch   similarity
8   10.167      23278313    64      NaN     NaN
9   10.167      23278313    47      NaN     NaN
10  10.167      23278313    38      NaN     NaN
28  10.333      3407159     49      10.167  0.983935
29  10.333      3407159     22      10.167  0.983935
30  10.333      3407159     16      10.167  0.983935
48  10.390      3299202     38      10.333  0.994514
49  10.390      3299202     35      10.333  0.994514
50  10.390      3299202     32      10.333  0.994514
68  10.516      2015786     50      10.390  0.988018

df['similarity']>0.99的时候,df['RT(min)'] = df['patch'],例如处理后的结果应该是这样的

7   RT (min)    Area (Ab*s) Quality patch   similarity
8   10.167      23278313    64      NaN     NaN
9   10.167      23278313    47      NaN     NaN
10  10.167      23278313    38      NaN     NaN
28  10.333      3407159     49      10.167  0.983935
29  10.333      3407159     22      10.167  0.983935
30  10.333      3407159     16      10.167  0.983935
48  10.333      3299202     38      10.333  0.994514
49  10.333      3299202     35      10.333  0.994514
50  10.333      3299202     32      10.333  0.994514
68  10.516      2015786     50      10.390  0.988018

48,49,50行的RT(min) 被相应的patch值给取代了

解决方法

利用mask

参数解释: Where cond is False, keep the original value. Where True, replace with corresponding value fromother. 也就是说,只有条件是true的 ,参会返回value

df['RT'] = df['RT'].mask(df['similarity'] > 0.99, df['patch'])

Pandas mask / where methods versus NumPy np.where

  • 5
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 这是一个技术问题,可以使用 pandas 库中的 replace 函数实现。具体操作可以参考以下代码: ``` import pandas as pd # 创建一份示例数据 df = pd.DataFrame({'列1': [1, 2, 3], '列2': ['A', 'B', 'C']}) print(df) # 将列2中为'A'的元素替换为'X' df['列2'] = df['列2'].replace('A', 'X') print(df) ``` 输出结果如下: ``` 列1 列2 0 1 A 1 2 B 2 3 C 列1 列2 0 1 X 1 2 B 2 3 C ``` ### 回答2: 在使用pandas中的DataFrame时,可以使用条件语句和布尔索引来根据一列元素替换一列的元素。 首先,我们可以使用df.loc[]方法选择满足条件的行,然后再使用赋操作来替换一列的元素。例如,假设我们有一个DataFrame df,有两列'A'和'B',我们要根据'A'列的元素替换'B'列的元素: ```python import pandas as pd # 创建示例DataFrame data = {'A': [1, 2, 3, 4, 5], 'B': ['a', 'b', 'c', 'd', 'e']} df = pd.DataFrame(data) # 根据条件替换元素 df.loc[df['A'] > 3, 'B'] = 'x' ``` 在上面的代码中,我们使用df.loc[df['A'] > 3, 'B']选择'A'列中大于3的行,并且将这些行对应的'B'列元素替换为'x'。 这样,根据一列元素替换一列的元素就完成了。 ### 回答3: 在df表中,我们可以使用DataFrame的.loc方法来根据一列元素替换一列的元素。 首先,我们可以根据条件过滤出需要替换的行,使用.loc方法选择这些行,并指定需要替换的列,再使用等号将需要替换的列与指定的元素。例如,假设df表中有两列"A"和"B",我们想把"A"列中为1的行的"B"列的元素替换为10,则可以使用以下代码: df.loc[df['A'] == 1, 'B'] = 10 这行代码首先选出了满足条件(df['A'] == 1)的行,然后选择列"B",并将其元素为10。 通过以上操作,我们可以根据一列元素替换一列的元素。需要注意的是,替换操作实际上是对原始数据的修改,所以请确保在操作之前备份数据或者在修改之后进行验证。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值