R语言 | 多元回归分析中的对照编码(contrast coding) | 第二节 deviation coding(偏差编码)

本文介绍了R语言中多元回归分析的Deviation Coding(偏差编码),这是一种对比编码方式,其回归系数之和为0。内容包括Deviation Coding的定义、如何计算各Level的均值偏差,以及Diet4系数的推导过程,揭示了这种编码的Sum Contrast特性,用于比较各Level对响应变量影响的大小。
摘要由CSDN通过智能技术生成

Deviation coding(或称为Effect Coding)是一种contrast编码方式。因为采用该contrast的回归方程的回归系数之和等于0,又称作sum contrast。


Deviation Coding的定义是每个Level的反应变量的均值(Mean_per_Level)每个Level的反应变量的均值的均值(Grand_Mean)进行对比。


参考dummy coding文中的例子。

如下是每个Level在反应变量weight上的均值(Mean_per_Level)

> tapply(ChickWeight$weight, ChickWeight$Diet, mean)
       1        2        3        4 
102.6455 122.6167 142.9500 135.2627 

Grand_Mean=(102.6455+122.6167+142.9500+135.2627) / 4=125.8687


对于Deviation Coding,R会创建从第1个Level到第K-1个Level的dummy variable,并将之与Grand_Mean进行对照(求差)而得到该Level上的dummy variabl

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值