工作中我们时常会根据现有DataFrame的一些字段去创建新的字段,刚开始的时候,我的做法大多数是按照下面模式:
df[‘new_col’] = df.col.apply(lambda x: x …)
去创造新的字段,其实还有其他的好的一些做法。
下面我介绍下pandas的一些技巧去提高处理此类问题的效率。
-
利用’assign’函数一次性创建多个字段:
下面可以看到,我不仅可以在现有字段上创建新的字段(beer_price, beer_onces),同时我们还能在刚刚创建的新字段中再次创造新的字段(beer_gallons)。
-
利用函数根据现有字段创建一串类似名字的字段:
for col in df.columns:
df[f’{col}_new’] = df[col].apply(my_function)