Series.map() 所有字符串和正则表达式方法都能被应用于各个值(传入lambda表达式或其他函数),但是如果存在NA就会报错。
e.g df_data中的一个字段‘category’中各个值都是字符串,由n个子字符串拼接而成 ,中间用;隔开
现在要求返回Series中各字符串是由几个子串构成,即返回n的值可以这么做:
def func( string ):
ss=string.split(';')
return len(ss)
num=df_train.category.map(func) 依然是一个Series对象