为什么需要广义表_广义线性模型多分类广义线性模型—因变量是多分类变量

该博客通过一个实例介绍了如何使用多分类广义线性模型分析城市和年龄对非黑色素瘤及皮肤癌发病的影响。研究发现,不同城市和年龄组的发病情况存在显著差异,城市A的发病风险相对较低,而随着年龄增长,发病可能性呈现下降趋势。
摘要由CSDN通过智能技术生成

c5fb124d7995b80d28680f6825cc1402.png

7c5b4bb0f2e2a62d692b8043bb489b70.png

多分类广义线性模型

—因变量是多分类变量

  【例】研究者对A和B两城市妇女非黑色素瘤及皮肤癌发病情况进行比较,以是否出现非黑色素瘤及皮肤癌早期症状为依据,判定其是否发病,所得资料如下表所示,试分析城市和年龄组对非黑色素瘤及皮肤癌发病是否有影响。(本例引用自陈希孺.广义线性模型(二)[J].数理统计与管理, 2002,21(6):57-64)

表1 A和B两城市妇女非黑色素瘤及皮肤癌发病情况 

8eaa444953ca0fa0a21bfe22ed7e5737.png

3430bffc74501cabc8101044ef8a1391.gif操作步骤 1 输入原始数据

  以15-24岁为年龄组1,25-34岁为年龄组2,35-44岁为年龄组3,45-54岁为年龄组4,55-64岁为年龄组5,65-74岁为年龄组6,75-84岁为年龄组7,84岁以上为年龄组8;城市A为1,城市B为2;发病为1,未发病为0,如下图所示。e74bc44aecb0cf4aec818e2d29394e03.png 

7a4cf1cf6d259cd7444bcb0a636fbd05.png

图1 原始数据输入结果

敲黑板讲重点

  需要注意的是,在原始数据输入时,需要设置“是否发病”的变量,用于表明后面的频数是发病或是未发病。

2 对个案进行加权

8573a568720bf97f5062582fde810014.png

图2 对个案进行加权

 e74bc44aecb0cf4aec818e2d29394e03.png 

f29d503100739fbc710ecc7879d9386a.png

图3 选择频数进行加权

3 调用命令 e74bc44aecb0cf4aec818e2d29394e03.png  

cc8ea761293c98530bfcdd9d2cb8640f.png

图4 广义线性模型的命令调用

4 选择相关项目

  首先因非黑色素瘤及皮肤癌发病是小概率事件,服从Poisson分布,则选择“泊松对数线性”为模型类型。

f0084c999c15eae43517066724694db7.png

图5 模型类型选项

  在响应对话框中,因变量为“是否发病”。e74bc44aecb0cf4aec818e2d29394e03.png 

08fa84098bf26c614b61b7aacdb9a5c7.png

图6 响应的选项

  预测变量的选项框中将“城市”和“年龄组”两个变量放入因子中。

04f471a25dc27437668b8b3ca9724e28.png

图7 预测变量的选项

  模型选项框中,选择变量“城市”、“年龄组”作为主效应。

9718e77a2a74fc4462986492410291f5.png

图8 模型效应的选项

 e74bc44aecb0cf4aec818e2d29394e03.png 

8c21ee6d2842bb05a874aca9caff5a95.png

图9 广义线性模型估算的选项

 e74bc44aecb0cf4aec818e2d29394e03.png 

80b89f32f11d7bcb60c3af04b4529197.png

图10 广义线性模型统计的选项

3430bffc74501cabc8101044ef8a1391.gif结果解读   首先输出的结果为模型中的分类变量和连续变量的描述信息和拟合优度情况。 e74bc44aecb0cf4aec818e2d29394e03.png

889b951c3fcc8cfaf382c5e68200f94d.png

  系统根据数据建立的模型,似然比卡方值为2940.825,P值小于0.001,模型成立。

7f5de562e337a057f26d1aded5fa2411.png

e74bc44aecb0cf4aec818e2d29394e03.png 

  模型效应的检验中,变量城市的P值小于0.001,说明不同城市,发病情况存在差异。变量年龄组的P值也小于0.001,则表明不同年龄组的女性,发病情况也有差别。e74bc44aecb0cf4aec818e2d29394e03.png 

923268832c5276f02024bf3b78cf1280.png

  从参数估计的结果来看,城市和年龄对妇女非黑色素瘤及皮肤癌发病情况均有影响。城市A妇女的发病情况是城市B的OR=exp(-0.730)倍。每个年龄组与年龄84以上组做比较的结果显示,回归系数均为负数,说明年龄84以上组的发病最高,并且,随着年龄的增长,回归系数的绝对值逐渐减小,说明年龄越大,发病的可能性就越高。 

4faac84d7a4099f72364b42e8afb3e79.png

e74bc44aecb0cf4aec818e2d29394e03.png 

3430bffc74501cabc8101044ef8a1391.gif论文表述   研究表明,城市和年龄组对非黑色素瘤及皮肤癌发病有影响,P值均小于0.001,城市A的妇女比城市B的妇女更不易患病(OR=exp(-0.730)),并且,随着年龄的增长,发病的可能性就越高,84岁以上妇女人群有更大可能性发病。

7365ab10547dca68dd6d8185cc2a54bd.png

微信编辑:陈卓

原创人员:何少平

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值