亚组分析、P交互、P趋势是什么?如何计算呢?

亚组分析、P交互、P趋势是什么?如何计算呢?

(1)亚组分析如何计算?

(2)P交互作用的计算方法?

(3)P趋势如何计算?

(1)亚组分析如何计算

本篇不说理论,直接以R语言的lung数据集为例进行介绍。

除P交互的外,亚组分析和P趋势的计算以logistic模型为例进行说明:

自变量:sex(性别),age(年龄),ph.ecog(ECOG评分),wt.loss(过去六个月的体重减轻)

因变量:status(是否死亡)

交互作用我们主要关注性别和年龄的交互。

假设:我们主要关注性别和死亡的关系?

首先:由于要研究性别和死亡的关系,因此我们建立的主要分析模型如下:

Logit(p)=β1sex+β2age+β3ph.ecog+β4wt.loss+残差

在这里,β1是我们关注的主要解释参数。age+ph.ecog+wt.loss都是协变量

R语言代码:

#数据处理

library(rms)

library(dplyr)

data<-lung

#生成二分类新变量

data$age1 <- ifelse(data$age > 60,

                        c("1"), c("2"))

data$status<-data$status-1

str(data)#查看数据类型

#转化因子

a<-c("sex","age1")#填入需要转化的变量

data[,a]<-lapply(data[,a],as.factor)#转因子

#建立模型

#logistic模型:sex和status的关系

fit1 <- glm(status~sex+age1+ph.ecog+wt.loss,data=data,family = "binomial")

broom::tidy(fit1)

#自编函数,计算OR值

formatFit<-function(fit){

  #取P值

  p<-summary(fit)$coefficients[,4]

  #wald值

  wald<-summary(fit)$coefficients[,3]^2

  #B值

  valueB<-coef(fit)

  #OR值

  valueOR<-exp(coef(fit))

  #OR值得95%CI

  confitOR<-exp(confint(fit))

  data.frame(

    B=round(valueB,3),

    Wald=round(wald,3),

    OR_with_CI=paste(round(valueOR,3),"(",

                     round(confitOR[,1],3),"~",round(confitOR[,2],3),")",sep=""),

    P=format.pval(p,digits = 3,eps=0.001)

  )

}

formatFit(fit1)#得出OR值

结果解释:OR=0.304,因此sex=2的死亡风险更低。

  1. 亚组分析如何计算

那么,为了进一步探讨,不同年龄组的性别和死亡的关系,我们需要将人群按照年龄组分为60岁以下和60岁以上两组,分别建立两个模型:

60岁以下:Logit(p)=β1sex+β3ph.ecog+β4wt.loss+残差

60岁以上:Logit(p)=β1sex+β3ph.ecog+β4wt.loss+残差

这时候模型中就去掉了age这个变量,然后会得到两个β1,这其实就是亚组分析,也叫分层分析。

R语言代码:

#亚组分析

data1<-subset(data,age>60)

data2<-subset(data,age<=60)

#60岁以上

fit2 <- glm(status~sex+ph.ecog+wt.loss,data=data1,family = "binomial")

#60岁以下

fit3 <- glm(status~sex+ph.ecog+wt.loss,data=data2,family = "binomial")

formatFit(fit2)

formatFit(fit3)

结果解释:OR=0.284和0.309,因此60岁以上和60岁以下,sex=2的死亡风险均更低。

(2)P交互作用的计算方法

那么OR=0.284和0.309,两者相等吗?这时候就需要计算P交互值了。

P交互值的计算方法有两种,一种是传统方法,一种是似然比检验。

  1. 传统方法:在模型中加入主要解释变量和亚组变量的交互项,交互项的P值即为P交互,本例的模型如下:

Logit(p)=β1sex+β2age+β3sex*age+β4ph.ecog+β5wt.loss+残差

β3的P值即为P交互。

  1. 似然比检验:步骤有三步

步骤1:建立有交互的模型,即Logit(p)=β1sex+β2age+β3sex*age+β4ph.ecog+β5wt.loss+残差

步骤2:建立无交互的模型,即Logit(p)=β1sex+β2age+β3ph.ecog+β4wt.loss+残差

步骤3:比较这个模型差异,计算的P值即为P交互

若P交互<0.05,则说明OR=0.284和0.309在统计学上有差异,否则无差异。

下面分别给出线性模型、logistic模型、cox模型传统方法和似然比检验计算交互P的代码:

#模型1:线性模型

#有交互模型

fit1 <- glm(meal.cal~sex*age1+sex+age1+ph.ecog+wt.loss,data=data,family = "gaussian")

broom::tidy(fit1)

#无交互模型

fit2 <- glm(meal.cal~sex+age1+ph.ecog+wt.loss,data=data,family = "gaussian")

broom::tidy(fit2)

#似然比检验

anova(fit1,fit2,test="Chisq")

#模型2:logistic模型

# 有交互模型

fit1 <- glm(status~sex*age1+sex+age1+ph.ecog+wt.loss,data=data,family = "binomial")

broom::tidy(fit1)

#无交互模型

fit2 <- glm(status~sex+age1+ph.ecog+wt.loss,data=data,family = "binomial")

broom::tidy(fit2)

#似然比检验

anova(fit1,fit2,test="Chisq")

#模型3:Cox模型

# 有交互模型

fit1 <- coxph(Surv(time,status)~sex*age1+sex+age1+ph.ecog+wt.loss,data=data)

broom::tidy(fit1)

#无交互模型

fit2 <- coxph(Surv(time,status)~sex+age1+ph.ecog+wt.loss,data=data)

broom::tidy(fit2)

#似然比检验

anova(fit1,fit2,test="Chisq")

(3)P趋势如何计算

由于P趋势的计算要求自变量至少为三种,因此,这里研究目的改为年龄和死亡的关系。

首先将年龄划分为<50,50~60,60~70,70及以上四组。

然后首先将年龄设置为哑变量,建立以下模型:

Logit(p)=β1age12+β2age13+β3age14+β4sex++β5ph.ecog+β6wt.loss+残差

我们会得到β1、β2、β3三个参数估计值,然后进一步得出OR1、OR2、OR3.

R语言代码:

###########P趋势的计算

#年龄分组

data <- within(data,{

  age1[age<50]=1

  age1[age>=50 & age < 60] = 2

  age1[age>=60 & age < 70] = 3

  age1[age>= 70] = 4

})

#变因子

data$age1<-as.factor(data$age1)

#设参照

data$age1<-relevel(data$age1, ref="1")

#建立模型

fit1 <- glm(status~age1+sex+ph.ecog+wt.loss,data=data,family = "binomial")

broom::tidy(fit1)

formatFit(fit1)

OR分别为2.055、1.454、2.433,这三个值在统计学有没有趋势性变化呢?这时候就需要计算P趋势值了。

目前有两种方法计算P趋势,以本例为例子进行说明

(1)将age变量编码为1、2、3、4,作为等级变量纳入模型,计算出的P值就是P趋势,P趋势的方向是正向还是反向,可以看估计的β值或OR值

(2)先将age变量编码为1、2、3、4,然后计算每一组的中位数,本例计算的中位数为。。。。,因此将原来的1、2、3、4替换成。。。。/,再作为等级变量纳入模型,计算出的P值就是P趋势,P趋势的方向是正向还是反向,可以看估计的β值或OR值

R语言代码:

############方法1:age1变为等级变量

#age1变为数值

data$age1<-as.numeric(data$age1)

#建立模型

fit1 <- glm(status~age1+sex+ph.ecog+wt.loss,data=data,family = "binomial")

broom::tidy(fit1)

formatFit(fit1)

############方法2:age1各组的中位数变为等级变量

library(dplyr)

# median of groups

summarise(group_by(data,age1),

          min(age),

          max(age),

          mean(age),

          sd(age),

          median(age),

          quantile(age,0.25),

          quantile(age,0.75),

          )

#age的中位数:44,56,64,7

data$age2[data$age1 == 1]<- 44

data$age2[data$age1 == 2]<- 56

data$age2[data$age1 == 3]<- 64

data$age2[data$age1 == 4]<- 73

#建立模型

fit1 <- glm(status~age2+sex+ph.ecog+wt.loss,data=data,family = "binomial")

broom::tidy(fit1)

formatFit(fit1)

结果解释:P趋势值>0.05,因此不同年龄的死亡风险无趋势性变化。

这里可以发现两种做法结果不太一致,目前主流的做法基本是第2种做法,因此,小编建议大家参考第2种做法,当然第1种做法也没错。

  • 14
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
ASP/ACCESS毕业论文:毕业设计综合管理系统(全套论文 代码 演示PPT) 随着计算机及计算机网络的普及和全国各院校的校园网络的日益完善、健全,各种工作的计算机网络化将逐步取代繁重的传统办公模式。毕业设计作为大学生四年学习的重要环节,也有必要实行计算机网络化管理,从而减轻设计指导老师的承重负担,简化立题、选题、评分等过程,让繁冗的课题设计信息采用计算机数据库统筹管理。因此,设计一种毕业设计综合管理系统是我校教学管理发展的一项任务,也是各院校教学发展的趋势。该系统为学生、教师、教务处提供一个交互的接口,大大的方便了学生、老师及教务处的管理人员。 论文目录 摘要 ………………………………………………………………………Ⅰ Abstract …………………………………………………………………Ⅱ 第1章 绪论 ………………………………………………………………1 第2章 系统简介 …………………………………………………………3 2.1系统开发背景 …………………………………………………3 2.2系统工作流程描述 ………………………………………………3 2.3系统操作流程图 …………………………………………………4 第3章 系统开发方法及工具简介 ………………………………………5 3.1系统开发简介 …………………………………………………5 3.1.1系统开发方法 ……………………………………………5 3.1.2 结构化生命周期法简介 …………………………………5 3.1.3快速原型法简介 …………………………………………7 3.2开发工具介绍 …………………………………………………8 3.2.1 ASP简介……………………………………………………8 3.2.2 VBScript简介 ……………………………………………9 3.2.3 ASP所需的环境……………………………………………9 3.2.4编辑工具 ………………………………………………10 3.2.5数据库简介 ……………………………………………10 3.2.6 Access的功能 …………………………………………10 3.2.7 Access数据库中的七个对象……………………………11 第4章 系统分析…………………………………………………………12 4.1系统分析介绍 …………………………………………………12 4.1.1技术可行性 ……………………………………………12 4.1.2经济可行性 ……………………………………………12 4.1.3操作可行性分析 ………………………………………12 4.2系统的综合要求 ………………………………………………12 4.2.1系统功能要求 ……………………………………………13 4.2.2系统运行要求 ……………………………………………13 4.3系统数据流图 …………………………………………………14 4.4数据字典 ………………………………………………………16 第5章 系统设计 …………………………………………………………19 5.1系统总体设计 …………………………………………………19 5.1.1系统的综合要求 …………………………………………19 5.1.2系统结构 …………………………………………………20 5.1.3系统结构层次图 ………………………………………21 5.1.4数据库结构 ………………………………………………22 5.2详细设计 ……………………………………………………28 5.2.1安全性设计 ………………………………………………28 5.2.2算法设计 ……………………………………………29 5.2.3代码设计原则 …………………………………………30 5.2.4各模块详细设计过程 …………………………………30 第6章 系统运行与测试 …………………………………………………42 6.1测试步骤 ………………………………………………………42 6.2数据测试 ………………………………………………………43 第7章 系统维护 …………………………………………………………44 结论 ……………………………………………………………………45 致 谢 ……………………………………………………………………46 参考文献 ………………………………………………………………47 附录 ……………………………………………………………………48
。Minitab 下载提供统计分析、可视化分析、预测式分析和改进分析来支持数据驱动型决策。无论是否具备统计背景知识,Minitab 都可以通过其易于使用的软件或统计专家支持网络帮助企业更好地预测结果、设计更出色的产品并创造更美好的未来。 统计和数据分析软件包 Minitab 19 中文多语特别版统计和数据分析软件包 Minitab 中文版 无缝的数据准备 仅需单击导入,即可自动完成数据准备。直观的菜单选项可用于排序、堆叠、转置数据并对其进行重新编码。 轻松展示演示文稿 将图形和输出结果直接导出到 Microsoft Word 或 PowerPoint,从而轻松创建演示文稿并共享结果。 发现和探索 查看当前和过去的数据以找出趋势和模式。揭开变量之间的隐藏关系。使用 Minitab 数据分析软件来识别能够回答最具挑战性的问题的重要因素。 描述性统计和推理性统计 即便是非统计专家也能轻松使用的统计。轻松确定分布、关联、异常或缺失。 关键的统计检验包括:配对 t 检验、单比率和双比率检验、正态性检验、卡方检验和非参数检验。 预测式分析 可深入数据内部的高级分析和机器学习技术。 用于 Logistic 回归、因子分析、变量聚类的工具。 可视化 展示您的发现的图形输出;散点图、气泡图、箱线图、点图、直方图、图表、时间序列图等。 在数据发生改变时对图形进行无缝更新。使用更新的笔刷功能放大图形的所需部分,更详细地研究关注点。 Minitab 的“协助” Minitab 的“协助”是内置的交互式功能,可指导您完成整个分析,甚至还可以帮助您解释和显示结果。 Quality Trainer Quality Trainer 电子学习课程(单独出售)包括动画课程、小测验和动手实践练习,可帮助您轻松学习使用 Minitab Statistical Software 的统计知识。 Minitab® 20 * 新增功能或改进功能 协助 测量系统分析 能力分析 图形分析 假设检验 * 回归 DOE 控制图 图形 散点图、矩阵图、箱线图、点图、直方图、控制图、时间序列图等 等线图和旋转 3D 图 概率图和概率分布图 数据更改时自动更新图形 * 对图形使用笔刷以研究关注点 * 导出:TIF、JPEG、PNG、BMP、GIF、EMF 基本统计量 描述性统计量 单样本 Z 检验、单样本 t 检验、双样本 t 检验、配对 t 检验 单比率检验和双比率检验 单样本 Poisson 率检验和双样本 Poisson 率检验 单方差检验和双方差检验 相关和协方差 * 正态性检验 异常检验 Poisson 拟合优度检验 回归 线性回归和非线性回归 * 二元、顺序和名义 Logistic 回归 * 稳定性研究 偏最小二乘 正交回归 Poisson 回归 图:残差、因子、等线、曲面等。 逐步:p 、AICc 和 BIC 选择标准 * 最佳子集 * 响应预测和优化 * 方差分析 方差分析 一般线性模型 混合模型 多元方差分析 多重比较 响应预测和优化 * 等方差检验 图:残差、因子、等线、曲面等。 均分析 测量系统分析 数据收集工作表 量具 R&R 交叉 量具 R&R 嵌套 扩展的量具重复性与重现性 量具运行图 量具线性和偏倚 类型 1 量具研究 属性量具研究 属性一致性分析 质量工具 运行图 Pareto 图 因果图 变量控制图:XBar、R、S、XBar-R、XBar-S、I、MR、I-MR、I-MR-R/S、区域、Z-MR 属性控制图:P、NP、C、U、Laney P’ 和 U’ 时间加权控制图:MA、EWMA、CUSUM 多变量控制图:T 方、广义方差、MEWMA 稀有事件控制图:G 和 T 历史/过程偏移控制图 Box-Cox 和 Johnson 变换 个体分布标识 过程能力:正态、非正态、属性、批处理 * Process Capability SixpackTM 公差区间 抽样验收和 OC 曲线 * 试验设计 确定性筛选设计 Plackett-Burman 设计 二水平因子设计 裂区设计 一般因子设计 响应曲面设计 混料设计 D 最优设计和基于距离的设计 田口设计 用户指定的设计 分析二进制响应 * 分析因子设计的变异性 修补试验 效应图:正态、半正态、Pareto 响应预测和优化 * 图:残差、主效应、交互作用、立方、等线、曲面、线框 可靠性/生存 参数分布分析和非参数分布分析 拟合优度测量 确切失效数据、右删失数据、左删失数据和区间删失数据 加速寿命检验 寿命数据回归 检验计划 阈参数分布 可修复系统 多种失效模式 概率单位分析 Weibayes 分析 图:分布、概率、故障、生存 保证分析 功效和样本数量 用于估计
### 回答1: Python Pyecharts 桑基图是一种数据可视化图表,可以用来展示不同类别之间的数量关系和流向。它可以帮助用户更直观地了解数据之间的关系和变化趋势,是数据分析和决策支持的重要工具之一。Pyecharts 是一个基于 Python 的开源数据可视化库,可以方便地生成各种类型的图表,包括桑基图。通过 Pyecharts,用户可以轻松地创建漂亮、交互式的数据可视化图表,从而更好地理解和分析数据。 ### 回答2: Python Pyecharts桑基图是一种数据可视化图表,它使用Python编程语言和pyecharts库创建。桑基图可以用于分析和展示数据的流向和交互关系。它由多个矩形组成,每个矩形代表一个数据量,它们的大小和位置表示不同数据之间的交互关系。 Python Pyecharts桑基图是一种非常强大的分析工具,它可以帮助分析人员更好地了解数据,并提供重要见解。使用Python编程语言和pyecharts库,开发者可以轻松地创建交互性桑基图。 在Python Pyecharts桑基图中,数据以节点的方式表示,并且通过连线显示节点之间的关系。这种图表可以用于多种类型的数据分析,例如流程分析交互分析和社交网络分析等。它使得数据分析工作更加直观、便捷和高效。 除此之外,Python Pyecharts桑基图还支持图例、缩放和导出等功能,使得用户可以更加灵活地使用和展示数据。并且pyecharts库还有大量的其他图表和组件可供使用,方便用户创建更多种类的数据可视化图表。 总的来说,Python Pyecharts桑基图是一款功能强大、易于使用的数据可视化工具,它可以帮助用户更好地理解和分析数据,为不同行业的数据分析工作者提供了便利的工具。 ### 回答3: Python Pyecharts桑基图是一个用于可视化数据的Python库,它提供了一种直观的方式来分析数据,并且易于理解和传达。桑基图主要用于呈现离散的数据,帮助我们明确观察数据之间的关系、趋势和变化。下面,我将详细介绍一下Python Pyecharts桑基图的特点和使用方法。 首先,Python Pyecharts桑基图可以通过各种类型的数据来展示不同维度、分类和性质之间的关系和互动。在桑基图中,各个分类被以短直线的形式呈现,并在其两侧呈现各个维度的大小,例如人数、金额等,从而清晰地展示出分类之间的数量和关系。此外,桑基图还可以对多维度的数据进行多层分析与比较,从而有效地在数据量大、分类繁多的情况下分析数据。 其次,Python Pyecharts桑基图的使用非常简单,通过几行代码即可实现。在使用Pyecharts桑基图时,我们主要需要定义图表的基础属性、添加数据项、指定坐标系等。Pyecharts提供了灵活的API,方便我们自定义图表的大小、标题、字体、颜色等各种属性,同时也支持多种数据格式的导入,包括Python内置数据类型、数据库中数据和Excel表格中数据等。因此,对于数据预处理和导入,我们只需要编写相应的Python代码即可轻松完成。 得一提的是,Pyecharts还提供了各种主题包,可以根据自己的需要进行选择。主题包中包含了不少风格和样式各异的模板,如深色与浅色、图标形状与颜色、坐标轴类型等多种选择。这些主题包不仅可以让我们的图表显得更为美观和专业,同时也可以提升数据的可读性和易理解性。 最后,总的来说,Python Pyecharts桑基图为Python数据处理和可视化带来了很大的便捷性和可视化效果。它拥有简单、灵活、易上手的特点,丰富的API和主题包,使它成为数据处理和可视化方面的首选工具之一。 不论是在商业分析、学术研究还是大数据分析等领域,Python Pyecharts桑基图都可以为我们解决各种问题和任务,帮助我们更加直观、精确地分析和处理数据。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

kaiming0000

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值