1、排序特征,对某变量进行排序,将排名作为一个新的变量
2、离散特征,等量划分和等值划分,先对某变量进行排序,等量划分直接按照样本量等量分割,等值划分按取值等间隔划分,然后将区间号作为一个新的变量
3、计数特征,对多个离散特征的n个取值进行计数,每个取值下的计算作为一个新的变量
4、缺失值特征,将某个样本的特征缺失数量作为一个特征,根据这个特征进一步构造离散特征
5、交叉特征,两两变量加减乘除
6、类别特征编码,One-Hot编码和哑编码,哑编码变量会少一个。
from sklearn.preprocessing import OneHotEncoder
import pandas as pd
data = pd.DataFrame(d
特征构造
最新推荐文章于 2024-05-14 10:21:21 发布