DataFrame 行遍历操作 df.apply() lambda

1、读入电子表格,获取dataframe数据

import pandas as pd
path='D:/test.xlsx'
df = pd.read_excel(path,dtype='str') 

2、定义自己的处理函数,稍后由lambda调用。要回写df,注意一定要有返回值。

#定一个参数用于演示
arg1=1
#定义函数
def myneed(df,arg1):
   df['类型']=arg1+1
   df['批次']=arg1+2
   return df

3、对dataframe调用apply()方法,即逐行遍历(axis=1))。

lambda x中x即df.apply的df,将df传入myneed函数(还可传入arg1等其它参数)进行运算

#本例,将完整的df传入函数:(lambda内,x即为df)
df=df.apply(lambda x:myneed(x,arg1),axis=1)

#扩展,你也可以将df['编号']传入函数:(lambda内,x即为df)
df=df.apply(lambda x:myneed(x['编号'],arg1),axis=1)

#扩展,你可以对df['编号']进行apply操作:(lambda内,x即为df['编号'])
df['序号']=df['编号'].apply(lambda x:myneed(x,arg1),axis=1)

4、总结:

一:采用apply()方式对dataframe行遍历操作效率较高。3万行电子表格数据的读入、计算、写入电子表格文件,全程仅需要30秒即可完成。

二、但需要结合lambda、自定义函数等进行操纵,对初学者不友好。

三、作为初学者,写此博文希望可以帮助到跟我一样的人。如果不足请留言指正。

  • 6
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: 使用`.apply(lambda x: )`可以对DataFrame列进操作,其中`x`表示Series中的每个元素。下面是一个例子: 假设有一个DataFrame `df`,其中有一列`'col'`: ``` import pandas as pd df = pd.DataFrame({'col': [1, 2, 3, 4, 5]}) ``` 如果想对这一列进平方操作,可以使用`.apply()`方法: ``` df['col_squared'] = df['col'].apply(lambda x: x**2) ``` 这将创建一个新的列`'col_squared'`,其中每个元素都是原列中对应元素的平方值。 ### 回答2: 在Python中使用`.apply(lambda x:)`函数可以对DataFrame的列进逐个元素的处理。lambda函数接受一个参数x,用来表示DataFrame的每个元素,通过对每个元素进相应的操作,然后将结果返回。以下是正确使用`.apply(lambda x:)`的示例: 1. 创建DataFrame: ``` import pandas as pd data = {'Name':['Tom', 'Nick', 'John'], 'Age':[20, 25, 30], 'Salary':[3000, 4000, 5000]} df = pd.DataFrame(data) ``` 2. 对列进处理: ``` df['Age'] = df['Age'].apply(lambda x: x + 1) ``` 上述代码会将'Age'列的每个元素加1,并将结果更新到'Age'列。 3. 返回新的列: ``` df['NewSalary'] = df['Salary'].apply(lambda x: x*1.1) ``` 上述代码会创建一个名为'NewSalary'的列,其中每个元素是原始'Salary'列的对应元素乘以1.1的结果。 4. 使用多个参数: 如果lambda函数需要多个参数,可以使用`.apply()`的`args`参数传递。例如: ``` def calculate_bonus(salary, performance): return salary * performance df['Bonus'] = df['Salary'].apply(lambda x: calculate_bonus(x, 0.1), args=(0.1,)) ``` 上述代码中,定义了一个带有两个参数的函数calculate_bonus(),然后将`args`参数设置为(0.1,),将其传递给`.apply()`函数。lambda函数中的第一个参数x表示'Salary'列的每个元素,0.1表示performance参数的值,通过`args`将其传递给calculate_bonus()函数。 总结:使用`.apply(lambda x:)`函数可以对DataFrame的列进逐个元素的处理,通过lambda函数对每个元素进处理,并将结果返回。可以使用`args`参数传递多个参数给lambda函数。 ### 回答3: 在使用Python中的pandas库时,可以通过`.apply(lambda x: )`方法对DataFrame的列进操作。 首先,`.apply()`方法用于将指定的函数应用到DataFrame的每一或每一列。而`lambda x:`则是一种匿名函数,用于定义一个简单的函数,其中`x`表示输入的参数。 通过`.apply(lambda x: )`可以实现对DataFrame的每个元素进自定义操作。例如,我们有一个DataFrame `df`,其中有一列`column1`,我们想要对该列的每个元素进平方操作,可以使用以下代码: ```python df['column1'] = df['column1'].apply(lambda x: x**2) ``` 这段代码会遍历`df`中`column1`列的每个元素,并将其平方后重新赋值给原来的位置。 除了简单的数学操作,`.apply()`方法还可以用于处理更复杂的函数。例如,我们有一个自定义函数`my_function()`,希望将该函数应用到`df`的每一,可以使用以下代码: ```python df = df.apply(lambda x: my_function(x), axis=1) ``` 这段代码会将`my_function()`应用到`df`的每一,其中`axis=1`表示按操作。 需要注意的是,在使用`.apply(lambda x: )`时,要确保所定义的函数和每个元素的数据类型相匹配,以防止出现意外的错误。另外,`.apply()`方法是一种相对较慢的操作,如果需要处理较大的DataFrame,可能需要考虑使用其他更高效的方法。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值