变量编码
在数据预处理的时候,我们经常会遇到类别型变量,要进行数值编码。比较简便的方法就是 sklearn.preprocessing import LabelEncoder,例如下面的数据
import pandas as pd
data = pd.read_excel('信贷.xlsx')
data.head()
我们想要将业务种类和客户性质进行编码,此时我们可以采取如下编码方法:
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
label1 = le.fit_transform(data['业务种类'])
label2 = le.fit_transform(data['客户性质'])
data['业务种类'] = label1
data['客户性质'] = label2
data.head()
结果如下: