ch9-脑外伤急救后迟发性颅脑损伤影响因素分析案例-logistic回归

卡方检验-考察分类变量相关性-“交叉表”或“设定表”中进行;

t检验-考察连续变量与分类变量相关性-“设定表”中进行;

线性logsitic回归-研究分类因变量与一组自变量(可连续可分类)的关系;

树结构模型-研究自变量间是否存在交互作用

广义线性模型-在更广范畴建立模型。

 

1、案例背景

收集脑外伤急救病例样本,分析哪些因素导致急救后的脑损伤发生。因变量:是否出现迟发性脑损伤,为两分类变量;自变量:有连续性变量、分类变量。

卡方检验:研究分类变量之间的关系;

由于因变量是两分类变量,所以不能用普通的线性回归或方差分析,所以建立logistic回归模型;

考虑到自变量间的交互作用,采用分类树模型。

2、数据理解

变量关联的图表描述:

连续变量分布情况

分析-描述统计-描述,再画堆积直方图和分组箱图进行数据展示。如下:

分类变量间联系的表格描述

分析-表-设定表

变量关联的单变量检验:

考察分类自变量的作用

研究分类因变量和分类自变量的关系,使用卡方检验,原假设:因变量与自变量相互独立。使用卡方检验有两种方法:一种是“交叉表”,分别看全部两个分类变量的关系;一种是制表过程中的“设定表”,将分类因变量与各个分类自变量的关系在一张表中全部显示出来。第一种方法有些繁琐,常用第二种方法。

注:从经验上讲,一般单变量分析时P值小于0.2的变量可以考虑在随后的多变量建模中继续加以考察,P值高于0.2的除非在专业上有很明确的意义,否则不做考察。

方法一:

方法二: 

 

考察连续自变量的作用

研究分类因变量和连续自变量的关系,建立logistic回归模型。但建模前进行预分析考察因变量和自变量之间的关系是否具有统计意义,有一种方法是连续因变量与分类自变量互换,进行t检验。同样在指标过程中完成,具体操作如下:

 3、构建二分类logistic回归模型

当因变量是分类变量时,使用多元线性回归模型拟合得到的实际上是因变量某个类别的发生概率。由于模型等式左侧的概率取值范围是(0,1),但右侧是(负无穷,正无穷),等式左右不匹配。而且概率与自变量的关系常常不是线性的。这对这两个问题,需要进行logit变换。

logit(P)=ln(p/(1-p))。对logit(P)建立线性回归模型,这就是logistic回归模型。

logistic回归模型是研究分类因变量的标准建模方法。

logistic回归模型的适用条件

因变量为二分类的分类变量或某事件的发生率,因变量要服从二项分布;

自变量与logit(P)之间为线性关系;

残差合计为0,且服从二项分布;

各观测对象相互独立。

由于logistic模型的残差为二项分布而不是正态分布,所以使用的是极大似然估计来解决方程的估计和检验问题。

logistic模型为发生概率预测模型。

初步尝试建模

 

 

 对于结果的具体解释间P172。有些难度,好好理解。

构建最终模型

通过对构建的初步模型中变量的显著性检验,最终引入3个变量(舒张压、激素、ln血小板)建立最终的logistic回归模型。

4、利用树模型发现交互项

在上节最终构建的模型存在两个问题,logitP与自变量的关系一定是线性的吗?有没有是曲线的可能?各自变量间存在交互作用吗?

解决办法:树结构模型提供了解决自变量交互作用、曲线关联问题,成为补充经典建模方法缺陷的一种有效工具。

树模型的基本思想:将总研究人群通过某些特征(自变量取值)分成数个相对同质的亚人群,群内因变量的取值高度一致,相应的变异/杂质尽量落在不同亚人群中。

根据因变量的类型(分类或连续),树结构模型分为分类树和回归树。

进行树模型分析

在本案例中,选择CRT算法,同时输出对候选自变量的重要性分析。具体操作如下:

分析结果显示,舒张压与血小板自然对数存在交互作用,且进行了候选自变量的重要性排序分析。

5、使用广义线性过程进行分析

 舒张压与血小板自然对数的交互项=手工建立一个新变量为上述两变量的乘积,加入模型进行分析。

logistic回归模型属于广义线性模型范畴,所以利用广义线性模型过程来完成。

广义线性模型扩展了一般线性模型,差别在:

广义线性模型的因变量分布从正态分布扩展到二项分布、泊松分布等指数分布簇;通过连接函数,把因变量期望值与自变量的线性部分取值连接起来。

构建仅包含主效应的模型(即不包括交互项):

在模型中加入交互项:

通过“计算变量”得到舒张压与血小板自然对数的乘积,在按上述步骤加入交互项信息。

 

转载于:https://www.cnblogs.com/yaofang/p/5654226.html

表情包
插入表情
评论将由博主筛选后显示,对所有人可见 | 还能输入1000个字符
相关推荐
<p> <span> </span> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <span style="color:#E53333;">92讲视频课+16大项目实战+课件源</span><span style="color:#E53333;">码+讲师社群闭门分享会</span> </p> <p style="font-size:11pt;color:#494949;">   </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <strong class="ql-size-14 ql-author-32569780"><span style="color:#337FE5;font-size:14px;">为什么学习数据分析?</span></strong> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <strong class="ql-size-14 ql-author-32569780"><span style="color:#337FE5;"><br /> </span></strong> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;">       人工智能、大数据时代有什么技能是可以运用在各种行业的?数据分析就是。 </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <br /> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;">       从海量数据中获得别人看不见的信息,创业者可以通过数据分析来优化产品,营销人员可以通过数据分析改进营销策略,产品经理可以通过数据分析洞察用户习惯,金融从业者可以通过数据分析规避投资风险,程序员可以通过数据分析进一步挖掘出数据价值,它和编程一样,本质上也是一个工具,通过数据来对现实事物进行分析和识别的能力。不管你从事什么行业,掌握了数据分析能力,往往在其岗位上更有竞争力。 </p> <p style="font-size:11pt;color:#494949;">  <span style="font-size:11pt;"> </span> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <span style="color:#337FE5;"><strong>本课程共包含五大模块:</strong></span> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <strong class="ql-size-14 ql-author-32569780"><span style="color:#337FE5;"><br /> </span></strong> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <strong class="ql-size-12 ql-author-32569780">一、先导篇:</strong> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <span class="ql-author-32569780">通过分析数据分析师的一天,让学员了解全面了解成为一个数据分析师的所有必修功法,对数据分析师不在迷惑。</span> </p> <p style="font-size:11pt;color:#494949;">   </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <strong class="ql-size-12 ql-author-32569780">二、基础篇:</strong> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> 围绕Python基础语法介绍、数据预处理、数据可视化以及数据分析与挖掘......这些核心技能模块展开,帮助你快速而全面的掌握和了解成为一个数据分析师的所有必修功法。 </p> <p style="font-size:11pt;color:#494949;">   </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <strong class="ql-size-12 ql-author-32569780">三、数据采集篇:</strong> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <span class="ql-author-32569780">通过网络爬虫实战解决数据分析的必经之路:数据从何来的问题,讲解常见的爬虫套路并利用三大实战帮助学员扎实数据采集能力,避免没有数据可分析的尴尬。</span> </p> <p style="font-size:11pt;color:#494949;">   </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <strong class="ql-size-12 ql-author-32569780">四、分析工具篇:</strong> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <span class="ql-author-32569780">讲解数据分析避不开的科学计算库Numpy、数据分析工具Pandas及常见可视化工具Matplotlib。</span> </p> <p style="font-size:11pt;color:#494949;">   </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <strong class="ql-size-12 ql-author-32569780">五、算法篇:</strong> </p> <p class="ql-long-32569780" style="font-size:11pt;color:#494949;"> <span class="ql-author-32569780">算法是数据分析的精华,课程精选10大算法,包括分类、聚类、预测3大类型,每个算法都从原理和案例两个角度学习,让你不仅能用起来,了解原理,还能知道为什么这么做。</span> </p> <p> <img alt="" src="https://img-bss.csdnimg.cn/202006110958102443.jpg" /> </p>
©️2020 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页