特征越多,特征一致性(可能)有问题的特征越多,
比如,
有100个特征,如果线上每个特征出问题的几率是1%,那么100个特征都不出问题的概率就是0.99^100,
有200个特征,如果线上每个特征出问题的几率是1%,那么200个特征都不出问题的概率就是0.99^200,
加更多特征,特征一致性问题越大,则线上效果越不好靠加特征提升,
所以对 冗余/同类型 特征的精简 在线上会起到作用。
特征越多,特征一致性(可能)有问题的特征越多,
比如,
有100个特征,如果线上每个特征出问题的几率是1%,那么100个特征都不出问题的概率就是0.99^100,
有200个特征,如果线上每个特征出问题的几率是1%,那么200个特征都不出问题的概率就是0.99^200,
加更多特征,特征一致性问题越大,则线上效果越不好靠加特征提升,
所以对 冗余/同类型 特征的精简 在线上会起到作用。