pandas DataFrame的apply函数result_type参数说明

       DataFrame的apply函数是对指定的轴进行循环处理,并返回处理的结果。这里有一个问题在于,如果对于每一次运算,返回的结果只有一个元素,那么最终得到的结果是一个Series;但是如果每次处理返回的不是一个元素,而是由单个或者多个元素组成的可迭代对象,比如列表,那么最终得到的是Series还是DataFrame呢?对此,可以使用apply函数的result_type参数来指定。

       result_type参数可以取'reduce','expand','broadcast'以及None,默认是None。

       reduce表示最终返回一个Seies,expand表示返回一个DataFrame,但是该DataFrame的columns(axis=1时,如果axis=0,则同样的类推)会被重新以从0开始的整数设定(如果是list-like对象,不是Series),原columns会被抛弃,所以expand下每次处理的返回结果的可迭代对象长度不一定要和原来的列数匹配,如果每次处理返回的是一个Series,那么被expand得到的最终的DataFrame的列名和Series的index是一致的。

       broadcast表示的是维持原来的列名不变(当然三个参数类型的index都不会变),所以这就要求每次处返回的结果的对象长度要和原来的列数一致,不然会报错。

       如果是None,则pandas会根据每次处理返回的结果类型自己判断,如果每次处理返回的是list-like的对象,则和reduce一样,但是如果每次处理返回的是一个Series,则和expand一样。

       最后要注意的是,result_type参数是在每次处理返回的对象是可迭代的才有意义,如果只是一个元素的话,那么最终得到的都是Series,result_type参数便没有意义了。还有resuly_type参数是在pandas0.23.0版本开始加入的,在该版本之前,分别有broadcast参数和reduce参数来分别设定,但是没有expand参数以及相应的功能。

示例代码:

import pandas as pd
import numpy as np

df=pd.DataFrame(np.arange(12).reshape(4,3),columns=['a','b','c'])
df.index=['d','e','f','g']
print(df)
[Out]: 
   a   b   c
d  0   1   2
e  3   4   5
f  6   7   8
g  9  10  11

#默认的None下,如果是list-like对象,则最终返回Series
df.apply(lambda x:[1,2,3],axis=1)
[Out]: 
d    [1, 2, 3]
e    [1, 2, 3]
f    [1, 2, 3]
g    [1, 2, 3]
dtype: object

#默认的None下,如果每次返回的是Series对象,则最终expand成DataFrame
df.apply(lambda x:pd.Series([1,2,3],index=['a','b','d']),axis=1)
[Out]: 
   a  b  d
d  1  2  3
e  1  2  3
f  1  2  3
g  1  2  3

#expand下,得到DataFrame,如果是list-like对象,列索引设为整数
df.apply(lambda x:[1,2,3],result_type='expand',axis=1)
[Out]: 
   0  1  2
d  1  2  3
e  1  2  3
f  1  2  3
g  1  2  3

#broadcast下,保持原DataFrame的列名不变,返回DataFrame,如果其中的[1,2,3]长度不为3,比如为[1,2],那么由于长度不匹配,便会报错
df.apply(lambda x:[1,2,3],result_type='broadcast',axis=1)
[Out]: 
   a  b  c
d  1  2  3
e  1  2  3
f  1  2  3
g  1  2  3

 

  • 5
    点赞
  • 17
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
在使用pandas dataframeapply()方法时,可以通过传递一个函数作为参数来对数据进行操作。apply()方法可以用于对每个元素、每行或每列应用函数。 例如,假设我们有一个名为df的pandas dataframe,可以使用apply()方法来对其中的元素进行平方根操作。我们可以传递np.sqrt函数作为参数,来对df中的每个元素进行平方根计算。具体操作如下: df.apply(np.sqrt) # 相当于np.sqrt(df) 这样,我们就可以得到一个新的dataframe,其中的每个元素都是原始df中对应元素的平方根。通过apply()方法和传递适当的函数,我们可以对dataframe中的数据进行灵活的操作和处理。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [pandas进阶--Dataframeapply方法](https://blog.csdn.net/qq_38727995/article/details/124459704)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [一文搞懂Pandas Dataframe中的apply方法](https://blog.csdn.net/weixin_39915649/article/details/126476752)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值