pandas中df.apply有什么作用？

沉默璇年

于 2024-07-24 09:39:17 发布

阅读量772

点赞数 9

文章标签： pandas python 大数据

本文链接：https://blog.csdn.net/qq_42573767/article/details/140653748

版权

在数据分析和处理中，特别是在使用Pandas库处理DataFrame对象时，df.apply() 是一个非常有用的函数。它的作用是将一个函数应用到DataFrame的行或列上，或者整个DataFrame上的元素，以进行数据转换或操作。

`df.apply()` 的基本用法

语法：

df.apply(func, axis=0, raw=False, result_type=None, args=(), **kwds)

参数说明：

func：要应用于每一行或每一列的函数。可以是一个自定义函数、lambda函数或者已有的函数。
axis：指定函数是沿着行（0）、列（1）还是直接作用于整个DataFrame（None，默认为0）。
raw：是否将Series对象传递给func，默认为False。如果为True，则每一行或列将作为Series对象传递给func，而不是作为Numpy数组。
result_type：指定返回的数据结构，可以是broadcast，reduce，或者expand，默认为None。
args：可选的额外参数传递给func。
应用场景
对每一行或每一列应用函数：
# 对每一列求平均值
import pandas as pd
data = { 'A': [1, 2, 3], 'B': [4, 5, 6], 'C': [7, 8, 9] }
df = pd.DataFrame(data)
# 对每一行求平均值
result = df.apply(lambda x: x.mean(), axis=0)
print(result)
输出：A 2.0 B 5.0 C 8.0 dtype: float64
使用自定义函数：
# 自定义函数，对每个元素加1
def add_one(x):
return x + 1
df = pd.DataFrame({ 'A': [1, 2, 3], 'B': [4, 5, 6] })
result = df.apply(add_one) print(result)
import numpy as np
df = pd.DataFrame({ 'A': [1, 2, np.nan], 'B': [4, np.nan, 6] })
# 填充每一列的缺失值为该列的均值
result = df.apply(lambda x: x.fillna(x.mean()), axis=0) print(result)
复杂操作：
# 判断每一行是否符合条件
df = pd.DataFrame({ 'A': [1, 2, 3], 'B': [4, 5, 6] })
def check_condition(row):
return row['A'] > 1 and row['B'] < 6
result = df.apply(check_condition, axis=1) print(result)
总结

df.apply() 是Pandas中强大的函数之一，它能够根据指定的函数对DataFrame的行、列或整个DataFrame进行操作和转换。通过合理利用axis参数，可以灵活地应用于不同的数据处理场景，使得数据清洗、转换和分析变得更加高效和方便。

沉默璇年

关注

9
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
pandas中df.apply有什么作用？

df.apply()是Pandas中强大的函数之一，它能够根据指定的函数对DataFrame的行、列或整个DataFrame进行操作和转换。通过合理利用axis参数，可以灵活地应用于不同的数据处理场景，使得数据清洗、转换和分析变得更加高效和方便。
复制链接

扫一扫

pandas中df.apply有什么作用？

df.apply() 的基本用法

应用场景

总结

`df.apply()` 的基本用法