【Pandas】pandas DataFrame apply-CSDN博客

本文链接：https://blog.csdn.net/weixin_39648905/article/details/147630581

Pandas2.2 DataFrame

方法	描述
DataFrame.apply(func[, axis, raw, …])	用于沿 DataFrame 的轴（行或列）应用一个函数

pandas.DataFrame.apply() 是一个非常强大的函数，用于沿 DataFrame 的轴（行或列）应用一个函数。它允许用户自定义函数来处理数据。

DataFrame.apply(func, axis=0, raw=False, result_type=None, args=(), by_row='compat', engine='python', engine_kwargs=None, **kwargs)

参数	类型	描述
`func`	function	应用在 DataFrame 每一行或每一列上的函数。
`axis`	{0 or ‘index’, 1 or ‘columns’}, default: 0	若为 `0`，函数应用于每一列；若为 `1`，函数应用于每一行。
`raw`	bool, default: False	如果为 `True`，则将行或列作为 NumPy 数组传入函数。否则作为 Series。
`result_type`	{‘expand’, ‘reduce’, ‘broadcast’, None}, default: None	控制结果的返回形式。仅当 `axis=1` 时有效。
`args`	tuple	传递给 `func` 的位置参数。
`by_row`	str	已弃用，保留用于兼容性。
`engine`	{‘python’}, default: ‘python’	执行引擎，当前只支持 Python。
`engine_kwargs`	dict, optional	传递给引擎的关键字参数。
`**kwargs`	任意关键字参数	会传递给 `func`。

import pandas as pd

df = pd.DataFrame({
    'A': [1, 2, 3],
    'B': [4, 5, 6]
})

# 计算每列的平均值
result = df.apply(lambda x: x.mean())
print(result)

输出：

A    2.0
B    5.0
dtype: float64

# 对每一行求和
result = df.apply(lambda x: x.sum(), axis=1)
print(result)

输出：

0    5
1    7
2    9
dtype: int64

# 使用 NumPy 数组进行操作
result = df.apply(lambda x: x[0] + x[1], axis=1, raw=True)
print(result)

输出：

0    5
1    7
2    9
dtype: int64

# 返回多个值并展开成多列
def my_func(row):
    return row['A'] * 2, row['B'] * 3

result = df.apply(my_func, axis=1, result_type='expand')
print(result)

输出：