1.前言
很多刚接触pandas的不太清楚,怎么进行类似于sql的多字段求和、或者类似于sas的多字段处理,下面举几个例子讲讲pandas如何进行多变量/多字段操作:
2.数据准备
首先,造一点数据用于举例:
代码:
import pandas as pd
df = pd.DataFrame([["a1",2,3],["a2",5,6],["b1",5,6]])
df.columns = ["a","b","c"]
3.一个简单的多字段求和例子
现在对b、c字段求和,生成d变量:
代码:
df['d'] = df[["a","b"]].apply(lambda x : sum(x) ,axis = 1)
4.例子原理解析
4.1 例子用到的apply函数
apply函数是用在dataframe的,而map函数是用在series的,基本上用多了pandas就会用到这两个函数,主要是给多列或多行做批量处理用的,功能非常强大,基本可以实现sas、sql的所有功能,也可以自定义批量处理函数,后续会专门陆续补充这两个函数的介绍内容。
4.2 axis参数的影响
对于刚刚接触pandas搞数据的小伙伴,这个参数可能有点让人难以理解,对于一般使用来说,只需要理解,当axis = 1的时候&#