Pandas中map、apply、transform函数

1、map函数

在pandas中,map()函数可以用于根据字典的映射关系转换数据。map()函数是用于Series对象的方法,他将Series中的每个元素根据字典的映射进行转换。

Series.map(func: Callable, na_action: Literal["ignore"] | None = ..., **kwargs)

参数:

na_action:是否忽略NaN,默认为None,可以设置成‘ignore’

我们以例子来实现,将dataframe中的性别转换成汉字。

import pandas as pd
data = pd. DataFrame (
    {"name": ['Jack', 'Alice', 'Lily', 'Mshis', 'Gdli' , 'Agosh', 'Filu', 'Mack', 'Lucy', 'Pony' ],
    "gender": ['F', 'M', 'F', 'F', 'M', 'F', 'M', 'M', 'F', 'F'],
    "age":[25, 34, 49, 42, 28, 23, 45, 21, 34, 29]}
)
data.gender=data.gender.map({"F":'男','M':'女'})
print(data)

 map也可以传替函数:

随机生成100个成绩,我们将成绩进行评级

import pandas as pd
import numpy as np

data=pd.DataFrame(np.random.randint(0,100,size=(100,1)),
                    columns=["python"]                
                  )
print(data)
def change(x):
    if x<60:
        return '不及格'
    elif x<80:
        return '中等'
    elif x<90:
        return '良好'
    else:
        return '优秀'
s=data.python.map(change)
data['等级']=s
print(data)

 2、apply函数

apply函数是用于DataFrame的方法,它可以用于数据转换和处理。其接受一个函数作为参数,并将参数应用到DataFrame中的每一行或每一列。

既支持Series也支持DataFrame

 随机生成100*3个数,我们计算平均值

import pandas as pd
import numpy as np

df=pd.DataFrame(np.random.randint(0,100,size=(100,3)),
                columns=['math','python','en']
                )
def cover(x):
    return x.mean().round(2),x.count(),x.median()

print(df.apply(cover,axis=0))
print('---------')
print(df.apply(cover,axis=1))

 再计算每一行的和

def sum(row):
    return row['math']+row['python']+row['en']

df['sum']=df.apply(sum,axis=1)#axis=0会报错
print(df)

 3、transfrom函数

在pandas中,transform函数用来对数据进行转换(允许对每个组的值进行操作),并返回与输入相同形状的结果,使得转换后的结果与原始数据保持对应的关系。

  • 基本用法

transform通常与groupby一起使用,允许你对每一组的数据进行操作。最常见的用途是计算每个组的某种统计量,并在原始数据框中返回相同的长度。

  • 语法

DataFrame.transform(func, axis=0, *args, **kwargs)

  • func: 一个函数或具有可调用对象的字符串,它定义了将应用到每个组的操作。
  • axis: 轴向,默认为0,适用于行。
  • args / kwargs: 可选参数,传递给函数。
  • 示例
import pandas as pd  

# 创建示例数据  
data = {  
    '部门': ['销售', '销售', '市场', '市场', '研发', '研发'],  
    '工资': [5000, 6000, 4500, 7000, 8000, 9000]  
}  
df = pd.DataFrame(data)  

# 使用groupby和transform计算每个部门工资的标准化  
df['工资标准化'] = df.groupby('部门')['工资'].transform(lambda x: (x - x.mean()) / x.std())  

print(df)

 关键点:

  1. 返回形状transform返回一个与原始数据结构相同大小的对象。
  2. 功能丰富: 可以使用任何适用于Series的函数,如mean()sum()min()max(), 等。
  3. 支持多个函数: 可以使用函数的名称作为字符串。
CSDN海神之光上传的代码均可运行,亲测可用,直接替换数据即可,适合小白; 1、代码压缩包内容 主函数:main.m; 调用函数:其他m文件;无需运行 运行结果效果图; 2、代码运行版本 Matlab 2019b或2023b;若运行有误,根据提示修改;若不会,私信博主; 3、运行操作步骤 步骤一:将所有文件放到Matlab的当前文件夹; 步骤二:双击打开main.m文件; 步骤三:点击运行,等程序运行完得到结果; 4、仿真咨询 如需其他服务,可私信博主或扫描博客文章底部QQ名片; 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作 功率谱估计: 故障诊断分析: 雷达通信:雷达LFM、MIMO、成像、定位、干扰、检测、信号分析、脉冲压缩 滤波估计:SOC估计 目标定位:WSN定位、滤波跟踪、目标定位 生物电信号:肌电信号EMG、脑电信号EEG、心电信号ECG 通信系统:DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪(CEEMDAN)、数字信号调制、误码率、信号估计、DTMF、信号检测识别融合、LEACH协议、信号检测、水声通信 1. EMD(经验模态分解,Empirical Mode Decomposition) 2. TVF-EMD(时变滤波的经验模态分解,Time-Varying Filtered Empirical Mode Decomposition) 3. EEMD(集成经验模态分解,Ensemble Empirical Mode Decomposition) 4. VMD(变分模态分解,Variational Mode Decomposition) 5. CEEMDAN(完全自适应噪声集合经验模态分解,Complementary Ensemble Empirical Mode Decomposition with Adaptive Noise) 6. LMD(局部均值分解,Local Mean Decomposition) 7. RLMD(鲁棒局部均值分解, Robust Local Mean Decomposition) 8. ITD(固有时间尺度分解,Intrinsic Time Decomposition) 9. SVMD(逐次变分模态分解,Sequential Variational Mode Decomposition) 10. ICEEMDAN(改进的完全自适应噪声集合经验模态分解,Improved Complementary Ensemble Empirical Mode Decomposition with Adaptive Noise) 11. FMD(特征模式分解,Feature Mode Decomposition) 12. REMD(鲁棒经验模态分解,Robust Empirical Mode Decomposition) 13. SGMD(辛几何模态分解,Spectral-Grouping-based Mode Decomposition) 14. RLMD(鲁棒局部均值分解,Robust Intrinsic Time Decomposition) 15. ESMD(极点对称模态分解, extreme-point symmetric mode decomposition) 16. CEEMD(互补集合经验模态分解,Complementary Ensemble Empirical Mode Decomposition) 17. SSA(奇异谱分析,Singular Spectrum Analysis) 18. SWD(群分解,Swarm Decomposition) 19. RPSEMD(再生相移正弦辅助经验模态分解,Regenerated Phase-shifted Sinusoids assisted Empirical Mode Decomposition) 20. EWT(经验小波变换,Empirical Wavelet Transform) 21. DWT(离散小波变换,Discraete wavelet transform) 22. TDD(时域分解,Time Domain Decomposition) 23. MODWT(最大重叠离散小波变换,Maximal Overlap Discrete Wavelet Transform) 24. MEMD(多元经验模态分解,Multivariate Empirical Mode Decomposition) 25. MVMD(多元变分模态分解,Multivariate Variational Mode Decomposition)
Pythonmap()和apply()都是用于对集合的元素进行函数操作的函数,但是它们在使用方式和功能上有一些区别。 1. map()函数: - map()函数接受一个函数和一个可迭代对象作为参数,然后将该函数应用于可迭代对象的每个元素,并返回一个包含结果的迭代器。 - map()函数返回的是一个惰性计算的结果,需要通过list()或者其他迭代器函数来获取结果。 - map()函数能够同时处理多个可迭代对象,将每个可迭代对象对应的元素作为参数传递给函数进行操作。 2. apply()函数: - apply()函数pandas的一个函数,用于在DataFrame或Series对象上应用函数操作。 - apply()函数接受一个函数作为参数,然后将该函数应用于DataFrame或Series的每一行或每一列,并返回一个包含结果的新的DataFrame或Series。 - apply()函数默认在每一列上应用函数操作,可以通过指定axis参数为1来在每一行上应用函数操作。 总结: - map()函数适用于对可迭代对象的每个元素进行函数操作,并返回一个迭代器。 - apply()函数适用于在DataFrame或Series上应用函数操作,并返回一个新的DataFrame或Series。 需要注意的是,apply()函数在处理大型数据集时效率较低,因为它是逐行或逐列进行操作的。在这种情况下,可以考虑使用其他更高效的函数,如applymap()、transform()或者矢量化操作。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值