DataFrame 根据同一行多列的值做判断,生成新的列值,df.apply,lambda的使用

主要是DataFrame.apply函数的应用,如果设置axis参数为1则每次函数每次会取出DataFrame的一行来做处理,如果axis为1则每次取一列。 

import pandas as pd
import os
pd.set_option('display.max_rows',1000)   # 具体的行数或列数可自行设置
pd.set_option('display.max_columns',1000)

df=pd.read_csv("testfile1.csv",header=0,encoding="gbk")

def new_sort(row):
    if row["sex"]=="男":
        part1="M"
    else:
        part1="F"
    if row["score"]>85:
        part2="A"
    else:
        part2="B"
    final=part1+"_"+part2
    return final

df["new_val"]=df.apply(lambda x:new_sort(x),axis=1)
print(df)

输出为:

       ID sex  subject  score new_val
0   10001   男  English    100     M_A
1   10002   女    Maths     85     F_B
2   10003   女  English     87     F_A
3   10004   女  science    100     F_A
4   10005   女  English     95     F_A
5   10006   男  science     96     M_A
6   10007   女    Maths     89     F_A
7   10008   男  science     87     M_A
8   10009   男      ICT     85     M_B
9   10010   男      ICT     97     M_A
10  10011   男    Maths     86     M_A

参考:https://blog.csdn.net/qq_30565883/article/details/79464266

 

以上,记录本人学习过程。

 

### 回答1: 使用`.apply(lambda x: )`可以对DataFrame列进操作,其中`x`表示Series中的每个元素。下面是一个例子: 假设有一个DataFrame `df`,其中有一列`'col'`: ``` import pandas as pd df = pd.DataFrame({'col': [1, 2, 3, 4, 5]}) ``` 如果想对这一列进平方操作,可以使用`.apply()`方法: ``` df['col_squared'] = df['col'].apply(lambda x: x**2) ``` 这将创建一个的列`'col_squared'`,其中每个元素都是原列中对应元素的平方。 ### 回答2: 在Python中使用`.apply(lambda x:)`函数可以对DataFrame的列进逐个元素的处理。lambda函数接受一个参数x,用来表示DataFrame的每个元素,通过对每个元素进相应的操作,然后将结果返回。以下是正确使用`.apply(lambda x:)`的示例: 1. 创建DataFrame: ``` import pandas as pd data = {'Name':['Tom', 'Nick', 'John'], 'Age':[20, 25, 30], 'Salary':[3000, 4000, 5000]} df = pd.DataFrame(data) ``` 2. 对列进处理: ``` df['Age'] = df['Age'].apply(lambda x: x + 1) ``` 上述代码会将'Age'列的每个元素加1,并将结果更到'Age'列。 3. 返回的列: ``` df['NewSalary'] = df['Salary'].apply(lambda x: x*1.1) ``` 上述代码会创建一个名为'NewSalary'的列,其中每个元素是原始'Salary'列的对应元素乘以1.1的结果。 4. 使用多个参数: 如果lambda函数需要多个参数,可以使用`.apply()`的`args`参数传递。例如: ``` def calculate_bonus(salary, performance): return salary * performance df['Bonus'] = df['Salary'].apply(lambda x: calculate_bonus(x, 0.1), args=(0.1,)) ``` 上述代码中,定义了一个带有两个参数的函数calculate_bonus(),然后将`args`参数设置为(0.1,),将其传递给`.apply()`函数。lambda函数中的第一个参数x表示'Salary'列的每个元素,0.1表示performance参数的,通过`args`将其传递给calculate_bonus()函数。 总结:使用`.apply(lambda x:)`函数可以对DataFrame的列进逐个元素的处理,通过lambda函数对每个元素进处理,并将结果返回。可以使用`args`参数传递多个参数给lambda函数。 ### 回答3: 在使用Python中的pandas库时,可以通过`.apply(lambda x: )`方法对DataFrame的列进操作。 首先,`.apply()`方法用于将指定的函数应用到DataFrame的每一或每一列。而`lambda x:`则是一种匿名函数,用于定义一个简单的函数,其中`x`表示输入的参数。 通过`.apply(lambda x: )`可以实现对DataFrame的每个元素进自定义操作。例如,我们有一个DataFrame `df`,其中有一列`column1`,我们想要对该列的每个元素进平方操作,可以使用以下代码: ```python df['column1'] = df['column1'].apply(lambda x: x**2) ``` 这段代码会遍历`df`中`column1`列的每个元素,并将其平方后重给原来的位置。 除了简单的数学操作,`.apply()`方法还可以用于处理更复杂的函数。例如,我们有一个自定义函数`my_function()`,希望将该函数应用到`df`的每一,可以使用以下代码: ```python df = df.apply(lambda x: my_function(x), axis=1) ``` 这段代码会将`my_function()`应用到`df`的每一,其中`axis=1`表示按操作。 需要注意的是,在使用`.apply(lambda x: )`时,要确保所定义的函数和每个元素的数据类型相匹配,以防止出现意外的错误。另外,`.apply()`方法是一种相对较慢的操作,如果需要处理较大的DataFrame,可能需要考虑使用其他更高效的方法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值