小技巧1:如何使用map对某些列做特征工程?
先生成数据:
d = {
"gender":["male", "female", "male","female"],
"color":["red", "green", "blue","green"],
"age":[25, 30, 15, 32]
}
df = pd.DataFrame(d)
df
在 gender
列上,使用 map 方法,快速完成如下映射:
d = {"male": 0, "female": 1}
df["gender2"] = df["gender"].map(d)
小技巧2:使用 replace 和正则清洗数据
Pandas 的强项在于数据分析,自然就少不了数据清洗。
一个快速清洗数据的小技巧,在某列上使用 replace 方法和正则,快速完成值的清洗。
源数据:
d = {"customer": ["A", "B", "C",