去除重复值并将缺失值补为0 对数字进行分箱处理,以年龄为例; 对文本进行变量转换,值较少时可用map,值多时用[49]的方法(LabelEncode转换而成的数字较大,故没有使用) 将变量转化为one-hot编码及提取Title特征