分类变量的水平一定要压缩
模型中分类变量一般需要处理成0-1形式的哑变量。
如果变量水平本身较多,那么哑变量的水平个数也会相应变多,这种情况下去构建模型肯定不行,需要将分类变量的水平进行压缩处理。
分类变量水平压缩的方法
一般情况,分类变量水平压缩有下面两种方法,这一篇先说说我对哑变量编码法的理解:
- 哑变量编码法;
-
基于目标变量的WOE转换法;
我眼中的哑变量编码法
建模时,如果入模变量有N个等级,为了避免
分类变量的水平一定要压缩
模型中分类变量一般需要处理成0-1形式的哑变量。
如果变量水平本身较多,那么哑变量的水平个数也会相应变多,这种情况下去构建模型肯定不行,需要将分类变量的水平进行压缩处理。
分类变量水平压缩的方法
一般情况,分类变量水平压缩有下面两种方法,这一篇先说说我对哑变量编码法的理解:
基于目标变量的WOE转换法;
我眼中的哑变量编码法
建模时,如果入模变量有N个等级,为了避免