import pandas as pd
import numpy as np
import os
os.listdir()
['.ipynb_checkpoints', '两列冗余数据清洗.ipynb', '人物画像.xlsx']
renwu = pd.read_excel("./人物画像.xlsx")
renwu
需求:我们可以看到以上数据城市这个字段出现了信息冗余,需要将多余的国家信息清洗掉
renwu["城市"] = renwu[["国家","城市"]].apply(lambda x:x[1].replace(x[0],""),axis=1)
renwu
一行代码搞定!!