ologit模型与logit_浅析Stata做logistic回归.ppt

本文详细介绍了如何使用Stata进行ologit模型和Logistic回归分析,包括检验不同logit函数中变量效应的一致性,以及如何进行有序结果的累积比数logistic回归。文中通过实例讲解了ologit命令的使用,如`ologit [因变量 [自变量]]`,并讨论了Logistic回归在二分类和多分类问题中的应用。此外,还提及了Stata中的其他logistic回归命令,如logit、blogit、clogit等,并介绍了逐步回归分析的方法。
摘要由CSDN通过智能技术生成

同一变量在不同的logit函数中的效应可能相同,亦可能不同,这可以通过test命令来检验。 test [1]x1=[2]x1 test [1]x2=[2]x2 有序结果的累积比数logistic回归 用于有序结果的logistic 回归的命令是ologit。 ologit [因变量 [自变量]] [,table level(#)] 其中选择项table用于指定打印出各类的概率;level用于指定显著性水平 例6 南通医学院陈佩珍教授研究了儿童智商等级与其母亲文化程度的关系,共收集了857名儿童的资料,见表6。 可以计算出OR=1.89, 解释为:当母亲的文化程度提高一个等级时,儿童智力提高一个或一个以上等级的可能性将增加0.89倍 小结 Logit、 blogit 、 glogit 、 blogit 、 clogit 、 mlogit 、 ologit 应用Stata做logistic回归 何保昌 实际生活中经常会遇到因变量只有0和1的二分类变量,不能满足正态性和方差齐性,故不能直接使用线性模型来拟合方程。 Logistic回归正是处理因变量是二分类或多分类变量的一种方法。现已广泛应用于队列研究,病例对照研究和试验性研究,成为分类因变量的首选多变量分析模型。 分类 按因变量性质,可分为二分类、无序多分类、有序多分类。 按是否匹配可分为非条件和条件logistic回归。 Stata软件专门有一组命令用于做不同类型的logistic回归,例如:logit、blogit、glogit、clogit、mlogit、ologit。 1.Logistic 回归 命令: logit 因变量 [自变量] [,选择项] 在进行logistic 回归时要注意资料的形式。通常,用于logistic 回归的资料有三种形式: (1) 分水平频数资料,一般自变量较少,且均为分类变量,常以各变量(包括因变量、自变量)各水平的组合的频数表形式出现。如例1。拟合时仍用上述命令,只是命令中增加[fw=频数变量]选择项。 (2) 分组频数资料,一般自变量较少,且均为分类变量,常以各自变量(不包括因变量)各水平的组合的频数表形式出现,因变量常表达为分子与分母。如例2。用下列命令: blogit 阳性数变量 总观察数变量 [,logit 命令选择项] 或 glogit 阳性数变量 总观察数变量 [,level(#) or] (3) 个体水平资料,即一个观察对象一条记录。如例3,直接使用logit 命令估计即可。 拟合模型后可以用指令predict 得到预测概率,然后进行模型诊断、应用等。 例1 本例是探讨妇女使用雌激素与患子宫内膜癌之间关系的病例-对照研究资料,见表1 ,请计算OR 及其95%可信区间。再用logistic 回归估计参数,写出回归方程,并说明回归系数与OR 的关系。 也可以用logit命令 可以利用例3做逐步回归 Stata 用于逐步回归分析的命令是在要执行的命令前增加sw 。 sw 回归命令 [因变量[自变量]], 筛选变量的P 值 [选择项] 其中,筛选变量的P 值有3 种组合 pr(#) /* 后退法 pe(#) /* 向前法 pr(#) pe(#) /* 逐步后退法 pr(#) pe(#) forward /* 逐步向前法 pr(#)是剔除变量的P 值,pe(#)是选入变量的P 值,如果只选pr(#),则表示用后退法,如果同时选用pr(#)和pe(#)表示逐步法。应用时,为防止计算进入死循环,pr(#)须略大于pe(#)。例如,pe(0.05),pr(0.051)。 1. 用逐步后退法,剔选变量的概率为:pe(0.05),pr(0.06),结果如下: sw logit y x1 x2 x3, pe(0.05) pr(0.06) 2. 用逐步前进法,剔选变量的概率不变,结果如下: sw logit y x1 x2 x3, pr(0.06) pe(0.05) forward 条件logistic 回归 非条件logistic 回归适用于平行组设计的病例-对照研究,队列研究,而不适用于配比设计的病例-对照研究。对于配比的病例-对照研究资料需要用条件logistic 回归。其命令为: clogit 因变量 [自变量] , group(配比变量) [ level(#) or ] 其中group()是必选项,它是用来区分各配比组的。level(#)及or 的意义同logit。 例4 在子宫内膜癌与使用雌激素关系的研究中,运用了1:4 的病例-对照研究,配比因素为年龄,共调查了20 对,100 例。 各变量定义如下: 1: match 配比组 2: y y=1:病例, y=0:对照

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
这段代码主要用于对输入数据进行三种不同的模型拟合,然后计算模型系数并进行比较和分析。具体每行代码的含义如下: ``` python linear_fit = LinearRegression().fit(x, y) ``` 使用线性回归模型对输入数据 x 和 y 进行拟合,并将拟合结果保存在 linear_fit 变量中。 ``` python logit_fit = LogisticRegression().fit(x, y.ravel()) ``` 使用逻辑回归模型对输入数据 x 和 y 进行拟合,并将拟合结果保存在 logit_fit 变量中。需要注意的是,这里将 y 转换为一维数组,以满足逻辑回归模型的输入要求。 ``` python prob_fit = GaussianNB().fit(x, y.ravel()) ``` 使用高斯朴素贝叶斯模型对输入数据 x 和 y 进行拟合,并将拟合结果保存在 prob_fit 变量中。同样需要将 y 转换为一维数组。 ``` python coef_mat = np.column_stack((prob_fit.theta.T, logit_fit.coef_, linear_fit.coef_)) ``` 将三种模型的系数按列方向拼接成一个矩阵 coef_mat,并将其保存在变量中。其中,prob_fit.theta.T 表示高斯朴素贝叶斯模型的均值向量,logit_fit.coef_ 表示逻辑回归模型的系数向量,linear_fit.coef_ 表示线性回归模型的系数向量。 ``` python print(coef_mat) ``` 输出拼接后的系数矩阵 coef_mat,用于查看模型系数的取值。 ``` python prop_mat = np.column_stack((prob_fit.theta_.T / logit_fit.coef_, prob_fit.theta_.T / linear_fit.coef_, logit_fit.coef_ / linear_fit.coef_)) ``` 计算三种模型系数之间的比例,并将比例矩阵 prop_mat 保存在变量中。其中,prob_fit.theta_.T 表示高斯朴素贝叶斯模型的方差向量,用于计算与其他模型系数的比例。 这段代码主要用于分析和比较三种不同的模型在给定数据上的表现,并通过系数比例来进一步分析模型的特点和差异。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值