- 三种编码:
哑变量编码(虚拟变量): dummy variable
与独热编码的区别:one-hot 删掉一列才是dummy variable
效应编码:效应编码与虚拟编码非常相似,区别在于参考类别现在由所有 -1的向量表示 - 系数解释:(以三个自变量为例)
截距项的均值
b0 是参照组的均值
b1 表示相比b0的均值差异
b2 表示相比b0的均值差异 - 分类变量回归 与 方差分析:
联系:先检验,具体再用posthoc事后检验的一些方法检验两两之间的差异性
区别:分类变量回归存在basic group,而方差分析不存在
分类变量的系数解释
最新推荐文章于 2023-01-29 19:03:56 发布