处理连续型特征 将连续型特征转换为分类特征,主要包括二值化与分段两种。 二值化 设置阈值,将特征值划分为0或1,在只考虑某种现象有无出现时可以进行该操作。 可以使用sklearn.preprocessing.Binarizer进行数据二值化。 from sklearn.preprocessing import Binarizer x = data.iloc[:,0].values.reshape(-1,1