广义线性模型
以前的线性模型用来分析变量分布,因变量多为正态分布,对于类别型变量和计数型并不合理,针对这些问题,可以考虑广义线性模型,情况如下:
![]()
glm()函数
R中可以使用glm函数来拟合广义线性模型,函数的基本形式为:
glm(formula,family=family(link=function),data=)
glm函数的常见参数如下:
![]()
glm函数可以拟合许多流行的模型,比如Logistic回归,泊松回归和生存分析
假设有响应变量Y,三个预测变量x1,x2,x3和一个包含数据的数据框
mydata
![]()
Logistic回归
Logistic回归多用于通过一系列连续型和类别型预测变量来预测二值型结果变量
下面将通过一个对婚外情的数据的研究来逐步讲解Logistic回归
![]()
因为我们只关心此人有没有婚外情,所以可以把数值二值化,将等于0的表示从来没有过婚外情的,大于等于1的表示出现过婚外情。
![]()
从上图中最后一列的p值,可以看出,性别、年龄和是否有孩子对结果影响都不大,所以可以去掉这些变量重新拟合:
![]()
![]()
![]()
![]()
泊松回归
泊松回归多用于通过一系列连续型和类别型的变量来预测计数型结果的变量
![]()
![]()
![]()
下面来拟合泊松回归:
![]()
![]()