pandas dataframe apply(fun) 踩过的坑

我这里的dataframe,只有一行数据

当我用dataframe直接调用apply方法并返回一个个series时,会print两次1

然而当我只返回一个列值的时候是不会有这个重复的问题的。

官方的解释:

apply在第一列/行上调用func两次,以决定是否可以进行某些优化。

而在pandas==0.18.1以及最新的pandas==0.23.4中进行尝试后发现,这个情况都存在

 

如果你有把握该df第一行会触发两次,你就可以用下列解决方案:

解决方案:

      

global flag
flag = False


def test(x):
    global flag
    if flag == False:
        flag = True
        return
    print(x)

通过全局变量控制跳过第一次 循环

其他解决方案,你可以用用设置唯一值来解决

亲测,可用

在使用pandas dataframeapply()方法时,可以通过传递一个函数作为参数来对数据进行操作。apply()方法可以用于对每个元素、每行或每列应用函数。 例如,假设我们有一个名为df的pandas dataframe,可以使用apply()方法来对其中的元素进行平方根操作。我们可以传递np.sqrt函数作为参数,来对df中的每个元素进行平方根计算。具体操作如下: df.apply(np.sqrt) # 相当于np.sqrt(df) 这样,我们就可以得到一个新的dataframe,其中的每个元素都是原始df中对应元素的平方根。通过apply()方法和传递适当的函数,我们可以对dataframe中的数据进行灵活的操作和处理。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [pandas进阶--Dataframeapply方法](https://blog.csdn.net/qq_38727995/article/details/124459704)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [一文搞懂Pandas Dataframe中的apply方法](https://blog.csdn.net/weixin_39915649/article/details/126476752)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值