泊松回归

这篇博客主要介绍了泊松回归的概念,它是统计学中的一种预测分析方法,常用于计数数据的建模。泊松回归在处理非负整数观测值,尤其是事件发生次数的数据时非常有用。文章可能涵盖了泊松分布的基本特性、泊松回归模型的建立过程以及在Python中的实现。对于数据科学和人工智能领域的从业者,掌握泊松回归是理解和解决计数问题的重要工具。
摘要由CSDN通过智能技术生成
  • 泊松回归介绍
泊松回归适用于在给定时间内响应变量为事件发生数目的情况,它假设 Y 服从泊松分布,线性模型的拟合形式为
07083104_sj2z.png
其中  07083104_p5ml.png 是 Y 的均值(也等于方差)。此时,连接函数为 07083104_K9ws.png,概率分布为泊松分布,拟合泊松回归模型如下
glm(Y ~ X1 + X2 + X3, family=poisson(link="log"),data=mydata)
1
1
 
1
glm(Y ~ X1 + X2 + X3, family=poisson(link="log"),data=mydata)

使用robust包中的breslow(癫痫数据)数据
响应变量为sumy(随机化后八周内癫痫发病数),预测变量为治疗条件(Trt)、年龄(Age)、前八周的基础癫痫发病数(Base)
观看基础的癫痫发病数和年龄,对响应变量的潜在影响,最后看下药物治疗能否减少癫痫的发病数
> data(breslow.dat,package = "robust") #导入robust包中的breslow数据
> names(breslow.dat)                   #变量名称
 [1] "ID"    "Y1"    "Y2"    "Y3"    "Y4"    "Base"  "Age"   "Trt"   "Ysum"  "sumY"  "Age10"
[12] "Base4"
> summary(breslow.dat[c(6,7,8,10)]) #获得6、7、8、10的变量数据等同于 breslow.dat[,c(6,7,8,10)]
      Base             Age               Trt          sumY       
 Min.   :  6.00   Min.   :18.00   placebo  :28   Min.   :  0.00  
 1st Qu.: 12.00   1st Qu.:23.00   progabide:31   1st Qu.: 11.50  
 Median : 22.00   Median :28.00                  Median : 16.00  
 Mean   : 31.22   Mean   :28.34                  Mean   : 33.05  
 3rd Qu.: 41.00   3rd Qu.:32.00                  3rd Qu.: 36.00  
 Max.   :151.00   Max.   :42.00                  Max.   :302.00  

#绘制图形观察基本的情况
> opar <- par(no.readonly = TRUE)  #复制一份图形设置
> par(mfrow = c(1,2))              #修改参数
> attach(breslow.dat)

> hist(sumY,breaks = 20,xlab="Seizure Count",
+      main="Distribution of Seizure")
> boxplot(sumY~Trt,xlab ="Treatment",main="Group Comparisons")
> par(opar)                        #还原原来的设置
22
22
 
1
> data(breslow.dat,package = "robust") #导入robust包中的breslow数据
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值