【Python】apply中的多参数函数，调整默认隐性参数位置

最新推荐文章于 2022-09-14 21:43:03 发布

浮点型队友

最新推荐文章于 2022-09-14 21:43:03 发布

阅读量5.6k

点赞数 5

分类专栏：学习记录文章标签： python apply函数 apply多参数函数 apply参数的位置 re.search参数 df.apply

本文链接：https://blog.csdn.net/weixin_42159940/article/details/89405757

版权

学习记录专栏收录该内容

16 篇文章 2 订阅

订阅专栏

前提知识：

re.search 的函数：re.search(pattern, string, flags=0)
df.aplly()函数

# 给定正则表达式，希望从df1['title']中找出匹配它的结果
regstr = "color.*ball.*pen"

# 自定义匿名函数 search_func，将re.search(x, y)的两个参数位置调换一下（为了df.appy函数中，能够正常使用多参数）
search_func = lambda x,y:re.search(y, x)

# apply里使用的函数search_func有多个参数，对第二个参数y要显性赋值，如果是df的一个字段，必须用引号
df1['title_new'] = df1['title'].apply(search_func, y=regstr)   #正确
df1['title_new'] = df1['title'].apply(re.search, pattern=regstr)  # re.search 语法错误。re.search的第一个参数pattern会默认是df1['title'] , 如果重复给pattern再次赋值regstr，就报语法错误。

# 额外练习：当apply中的函数的多参数是df中的字段时，如何使用？
# df1['title_new'] = df1['title'].apply(search_func, y="sku")   #正确。sku是df1中的一个列名，需要用引号。

df1[df1['title_new'].notna()]