- 泊松回归介绍
泊松回归适用于在给定时间内响应变量为事件发生数目的情况,它假设 Y 服从泊松分布,线性模型的拟合形式为
其中
是 Y 的均值(也等于方差)。此时,连接函数为
,概率分布为泊松分布,拟合泊松回归模型如下
glm(Y ~ X1 + X2 + X3, family=poisson(link="log"),data=mydata)
1
1
1
glm(Y ~ X1 + X2 + X3, family=poisson(link="log"),data=mydata)
例
使用robust包中的breslow(癫痫数据)数据
响应变量为sumy(随机化后八周内癫痫发病数),预测变量为治疗条件(Trt)、年龄(Age)、前八周的基础癫痫发病数(Base)
观看基础的癫痫发病数和年龄,对响应变量的潜在影响,最后看下药物治疗能否减少癫痫的发病数
> data(breslow.dat,package = "robust") #导入robust包中的breslow数据
> names(breslow.dat) #变量名称
[1] "ID" "Y1" "Y2" "Y3" "Y4" "Base" "Age" "Trt" "Ysum" "sumY" "Age10"
[12] "Base4"
> summary(breslow.dat[c(6,7,8,10)]) #获得6、7、8、10的变量数据等同于 breslow.dat[,c(6,7,8,10)]
Base Age Trt sumY
Min. : 6.00 Min. :18.00 placebo :28 Min. : 0.00
1st Qu.: 12.00 1st Qu.:23.00 progabide:31 1st Qu.: 11.50
Median : 22.00 Median :28.00 Median : 16.00
Mean : 31.22 Mean :28.34 Mean : 33.05
3rd Qu.: 41.00 3rd Qu.:32.00 3rd Qu.: 36.00
Max. :151.00 Max. :42.00 Max. :302.00
#绘制图形观察基本的情况
> opar <- par(no.readonly = TRUE) #复制一份图形设置
> par(mfrow = c(1,2)) #修改参数
> attach(breslow.dat)
> hist(sumY,breaks = 20,xlab="Seizure Count",
+ main="Distribution of Seizure")
> boxplot(sumY~Trt,xlab ="Treatment",main="Group Comparisons")
> par(opar) #还原原来的设置
22
22
1
> data(breslow.dat,package = "robust") #导入robust包中的breslow数据