泊松回归

最新推荐文章于 2024-04-01 22:09:31 发布

helloxielan

最新推荐文章于 2024-04-01 22:09:31 发布

阅读量5.4k

点赞数

文章标签： python 人工智能数据结构与算法

原文链接：https://my.oschina.net/u/1785519/blog/1563551

版权

这篇博客主要介绍了泊松回归的概念，它是统计学中的一种预测分析方法，常用于计数数据的建模。泊松回归在处理非负整数观测值，尤其是事件发生次数的数据时非常有用。文章可能涵盖了泊松分布的基本特性、泊松回归模型的建立过程以及在Python中的实现。对于数据科学和人工智能领域的从业者，掌握泊松回归是理解和解决计数问题的重要工具。

摘要由CSDN通过智能技术生成

2019独角兽企业重金招聘Python工程师标准>>>

泊松回归介绍

泊松回归适用于在给定时间内响应变量为事件发生数目的情况，它假设 Y 服从泊松分布，线性模型的拟合形式为

其中

是 Y 的均值（也等于方差）。此时，连接函数为

，概率分布为泊松分布，拟合泊松回归模型如下

glm(Y ~ X1 + X2 + X3, family=poisson(link="log"),data=mydata)

 
glm(Y ~ X1 + X2 + X3, family=poisson(link="log"),data=mydata)

例

使用robust包中的breslow（癫痫数据）数据

响应变量为sumy（随机化后八周内癫痫发病数），预测变量为治疗条件（Trt）、年龄（Age）、前八周的基础癫痫发病数（Base）

观看基础的癫痫发病数和年龄，对响应变量的潜在影响，最后看下药物治疗能否减少癫痫的发病数

> data(breslow.dat,package = "robust") #导入robust包中的breslow数据
> names(breslow.dat)                   #变量名称
 [1] "ID"    "Y1"    "Y2"    "Y3"    "Y4"    "Base"  "Age"   "Trt"   "Ysum"  "sumY"  "Age10"
[12] "Base4"
> summary(breslow.dat[c(6,7,8,10)]) #获得6、7、8、10的变量数据等同于 breslow.dat[,c(6,7,8,10)]
      Base             Age               Trt          sumY       
 Min.   :  6.00   Min.   :18.00   placebo  :28   Min.   :  0.00  
 1st Qu.: 12.00   1st Qu.:23.00   progabide:31   1st Qu.: 11.50  
 Median : 22.00   Median :28.00                  Median : 16.00  
 Mean   : 31.22   Mean   :28.34                  Mean   : 33.05  
 3rd Qu.: 41.00   3rd Qu.:32.00                  3rd Qu.: 36.00  
 Max.   :151.00   Max.   :42.00                  Max.   :302.00  

#绘制图形观察基本的情况
> opar <- par(no.readonly = TRUE)  #复制一份图形设置
> par(mfrow = c(1,2))              #修改参数
> attach(breslow.dat)

> hist(sumY,breaks = 20,xlab="Seizure Count",
+      main="Distribution of Seizure")
> boxplot(sumY~Trt,xlab ="Treatment",main="Group Comparisons")
> par(opar)                        #还原原来的设置

 
> data(breslow.dat,package = "robust") #导入robust包中的breslow数据

最低0.47元/天解锁文章

helloxielan

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫