一、特征工程(FS)
大致可分为两部分:预处理与特征选择(Feature selection)部分
![在这里插入图片描述](https://img-blog.csdnimg.cn/20200502104751635.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80MzA0MTAwOQ==,size_16,color_FFFFFF,t_70#pic_center)
二、task3代码-feature engineering
【Datawhale】[task3]3.3代码示例
三、问题
1、特征构造
# 训练集和测试集利用concat放在一起,方便构造特征? Train_data['train']=1 Test_data['train']=0#这是各自新增加了一列'train'吗?? data=pd.concat([Train_data,Test_data],ignore_index=True) # 忽略索引
2、分桶(箱)的结果??