需求:将name列的最后四个字取出来(sub列),再看comp_name列是否包含sub列
#首先定义字符串包含函数
def contain_string(string1, string2):
if string1 in string2:
return 1
else:
return 0
#取name列的最后四个字
data_bank[‘sub’] = data_bank[‘name’].apply(lambda x: str(x)[-4:]) #这里的x是data_bank[‘name’]中的数据
#调用函数,包含为1,否则为0
#这里的row是data_bank数据,因为取name和comp_name的数据时要索引
#axis = 1表示对每行操作
data_bank[‘bank_flag’] = data_bank.apply(lambda row: contain_string(str(row[‘sub’]), str(row[‘comp_name’])), axis = 1)