Stata
文章平均质量分 66
天桥下的卖艺者
4个R包的编写者。发布关于SPSS、R语言、stata等相关科研的文章。今后的方向聚焦于:1.机器学习和深度学习 2.各种模型算法研究 3.各种科研图形绘制 4.R语言编程和R包编写 5.数据挖掘
展开
-
stata两种方法查看命令源代码
我们使用stata的时候有时候需要知道某个命令的工作原理,或者对某个命令进行改进,因此需要知道命令的源代码。今天介绍两种方式查看命令的源代码,stata有个lroc命令是画出ROC曲线,这个命令我们很感兴趣,想知道它是怎么工作的,以便我们进一步做研究。这样也可以了,viewsource命令还可以查看外部包的代码,有个画列线图的包叫nomocox.,我们查看一下。Stata查看命令还是比较方便的,本章结束,QQ群已经满人了,加不了了,抱歉。一种方法是先找到它所在的位置,用记事本把它打开,使用which函数。原创 2022-10-31 09:39:22 · 4853 阅读 · 0 评论 -
stata手动绘制logistic回归预测模型校准曲线(Calibration curve)校准曲线(1)
数据解释如下:low 是否是小于2500g早产低体重儿,age 母亲的年龄,lwt 末次月经体重,race 种族,smoke 孕期抽烟,ptl 早产史(计数),ht 有高血压病史,ui 子宫过敏,ftv 早孕时看医生的次数,bwt 新生儿体重数值。一般分为两种,一种是通过Hosmer-Lemeshow检验,把P值分为10等分,求出每等分的预测值和实际值的差距。校准曲线图表示的是预测值和实际值的差距,作为预测模型的重要部分,目前很多函数能绘制校准曲线。我们先导入数据,继续使用我们的早产数据。原创 2022-10-18 09:44:56 · 4361 阅读 · 0 评论 -
Stata绘制分类带可信区间的折线图
论文中折线图可以表示两个变量间的变化关系,带误差或可信区间的折线图表示其中一个变量的变化范围,既往我们已经使用R语言绘制了分类带误差和可信区间的折线图,今天我们使用Stata来绘制分类带误差和可信区间的折线图。然后画连接线,这里我们使用mlcolor(blue)lcolor(blue)控制颜色,控制的是先得颜色和便面环的颜色,填充的颜色还没有改,所以有点怪怪的。我们来看下数据,car就是汽车售价,age是年龄,gender是性别,inccat是收入,这里分成4个等级,ed是教育程度。原创 2022-09-02 16:13:29 · 7658 阅读 · 2 评论 -
stata进行数据分组转换操作及分组统计
这样每个年龄组购车的平均售价就出来了,同理还可以求中位数,标准差等等很多内容,缺点是by参数只能分组一个变量,分组两个变量就会报错,不能计算标准误,需要手动计算。OK,这样我们的数据转换就完成了,和我们用R语言做出来的一模一样哦,本章完结,如果觉得有用,记得分享给需要的人哦。我们来看下数据,car就是汽车售价,age是年龄,gender是性别,inccat是收入,这里分成4个等级,ed是教育程度。继续使用我们的汽车销售数据(公众号回复:汽车销售,可以获得该数据)来演示,先导入数据,我是直接粘贴。......原创 2022-08-10 12:30:29 · 22393 阅读 · 0 评论 -
Stata制作限制立方样条(RCS)(2)
在许多研究中,识别、呈现和讨论定量或连续协变量(也称为预测变量、自变量或解释变量)与响应变量之间的估计关系非常重要。临床上,因变量和临床的结局有时候不是线性关系,而回归模型有一个重要的假设就是自变量和因变量呈线性关联,因此非线性关系模型用回归分析来拟合受到限制。因此,一个更好的解决方法是拟合自变量与因变量之间的非线性关系,限制性立方(Restricted cubic spline,RCS)就是分析非线性关系的最常见的方法之一。既往文章《stata两种方法制作限制立方条图》中,我们已经介绍了怎么使用stat原创 2022-07-05 11:59:49 · 7471 阅读 · 9 评论 -
基于stata的medsens包进行中介效应分析
中介变量(mediator) 是一个重要的统计概念,如果自变量 X 通过某一变量 M 对因变量 Y 产生一定影响,则称 M 为 X 和 Y 的中介变量。我们既往已经介绍了SPSS和R语言行中介效应分析,今天继续介绍stata中介效应分析,大家都在介绍sgmediation包,我就不说了。Imai, Kosuke, Luke Keele and Dustin Tingley (2010)的文章指出,做中介效应还应进行敏感性分析。 mediation包相比sgmediation包的优势是能进行敏感性分析,和R语原创 2022-04-19 19:11:57 · 6731 阅读 · 14 评论 -
手把手教你使用stata进行lasso回归
Stata版本目前已经更新到17了,外观也精美了许多,很增加了许多新的功能,如制作表格导出,双重差分法。自从更新到了16版本后自带了lasso回归功能,到了17以后功能更加强大了,多了可使用 “贝叶斯信息准则”(Bayesian Information Criterion,简记BIC)选择惩罚参数,新增选择项 “cluster(clustvar)” 来处理聚类数据。LASSO 回归也叫套索回归,是通过生成一个惩罚函数是回归模型中的变量系数进行压缩,达到防止过度拟合,解决严重共线性的问题,LASSO 回原创 2022-04-11 08:43:45 · 13558 阅读 · 9 评论 -
stata绘制meta分析漏斗图
meta分析中结果有些会产生偏倚,偏倚的识别方法有: 漏斗图法、 Begg秩相关法、 Egger 回归法。我们今天来介绍使用stata绘制meta分析漏斗图,虽然讲得有点迟了,但是还要讲一讲,也许有些人需要呢。首先要进行stata的meta分析模块进行安装,不懂的看看我的上一篇文章《Stata绘制(meta分析)森林图(1)》,安装好以后我们先要导入数据(回复:森林图数据1,可以获得数据),我就直接黏贴进去了一个很简单的数据,stud表示研究名称,a为实验组阳性人数,b为实验组总人数,c为对照组阳原创 2022-03-29 09:31:40 · 10490 阅读 · 4 评论 -
stata行logistic回归交互项(交互作用)的可视化分析(1)
交互作用效应(p for Interaction)在SCI文章中可以算是一个必杀技,几乎在高分的SCI中必出现,因为把人群分为亚组后再进行统计可以增强文章结果的可靠性,不仅如此,交互作用还可以使用来进行数据挖掘。在既往文章中,我们已经介绍了怎么使用R语言可视化visreg包对交互作用进行可视化分析(见下图),在既往文章中,我们已经使用R语言和SPSS分别绘制了logistic回归交互效应的可视化分析,后台有粉丝希望做一期stata交互效应的可视化分析,现在我们来使用stata演示一下logistic回原创 2022-02-23 09:31:03 · 18130 阅读 · 10 评论 -
Stata两种方法进行cox回归外部验证(1)
COX回归是临床常用的一种分析方法,多用于肿瘤、血液等疾病患者,其考虑到了临床随访删失情况,多用与生存分析。我们既往已经介绍了使用stata进行logistic回归内部验证和外部验证。今天我们继续来介绍stata进行cox回归内部验证和外部验证。这次使用的是一个肺癌数据集(公众号回复:肺癌,可以获得数据),我们先导入数据看看我们来看看数据的结构,inst:机构代码,time: 以天为单位的生存时间,status:结局变量,审查状态 1=审查,2=死亡,age: 年龄,sex: 性别男=1 女=2,p转载 2021-11-21 16:24:16 · 2613 阅读 · 0 评论 -
Stata绘制(meta分析)森林图(1)
森林图被用于各种类型的分析,尤其是meta分析,网状meta分析,交互效应分析,既往我们已经介绍了使用R绘制交互效应的森林图,今天我们来介绍stata绘制森林图,绘制森林图可以说是stata的强项,绘制起来非常简单,做meta分析,网状meta分析都非常容易。今天我们先来介绍stata 的meta dialog包的安装和简单森林图的绘制。首先打开stata—help—search然后点击Search network resources,在搜索内容点击然后选择pr0012然后点击安装就可以了原创 2021-10-19 11:38:00 · 17208 阅读 · 3 评论 -
stata进行logistic回归内部验证和外部验证
我们既往已经介绍了使用Stata进行logistic回归绘制列线图并做内部验证,不少粉丝发信息问我怎么进行外部验证。今天我们来介绍一下,继续使用我们的不孕症数据(公众号回复:不孕症可以获得该数据)。我们数据先导入看一下数据有8个指标,最后两个是PSM匹配结果,我们不用理他,其余六个为:Education:教育程度,age:年龄,parity产次,induced:人流次数,case:是否不孕,这是结局指标,spontaneous:自然流产次数。既然是外部验证,那必须有外部数据,我们在这里简单的对数据进原创 2021-09-16 11:41:29 · 6928 阅读 · 0 评论 -
使用stata临床决策曲线进行外部模型验证
DCA(Decision Curve Analysis)临床决策曲线是一种用于评价诊断模型诊断准确性的方法。在既往文章中,我们已经介绍了使用stata制作logistic回归和cox回归的临床决策曲线,今天我们来聊聊使用stata临床决策曲线进行外部模型验证,假设你有2个数据集,一个建模后作出临床决策曲线,想通过另一个数据集来进行验证,或者你在文献上看到别人的模型公式,想通过自己的数据来验证别人模型的效能,都可以使用这样的方法来进行。图片来源文章:Urinary Podocalyxin as a Bio原创 2021-07-13 09:20:22 · 2937 阅读 · 1 评论 -
stata基于cox回归制作临床决策曲线
DCA(Decision Curve Analysis)临床决策曲线是一种用于评价诊断模型诊断准确性的方法。上一节中我们介绍了stata使用dca包来进行logistic回归的临床决策曲线,有不少朋友发信息说不会制作cox回归制作临床决策曲线,今天我们继续来介绍怎么使用stdca包是用来制作cox回归临床决策曲线,首先要安装stdca包,可以看我上一篇文章怎么安装。继续使用我们的乳腺癌数据,既往我们已经使用R语言ggDCA包来制作cox回归临床决策曲线,等会我们使用stata制作会进行比较一下先把乳腺原创 2021-06-18 10:03:19 · 2204 阅读 · 5 评论 -
手把手教你使用stata制作临床决策曲线
DCA(Decision Curve Analysis)临床决策曲线是一种用于评价诊断模型诊断准确性的方法,在2006年由AndrewVickers博士创建,我们通常判断一个疾病喜欢使用ROC曲线的AUC值来判定模型的准确性,但ROC曲线通常是通过特异度和敏感度来评价,实际临床中我们还应该考虑,假阳性和假阴性对病人带来的影响,因此在DCA曲线中引入了阈概率和净获益的概念。图片来源文章:Urinary Podocalyxin as a Biomarker to Diagnose Membranous Ne原创 2021-05-31 10:57:26 · 5173 阅读 · 7 评论 -
stata两种方法制作限制立方条图
我们前面已经讲了怎么使用R语言制作限制立方条图,今天来讲讲怎么使用stata制作限制立方条图,参考了网上常见的两种做法,顺便比较一下做图出来的差异,然后在和R语言比较一下。首先要导入stata的xblc包,我们可以打入命令search xblc, net安装后以后就可以制作了限制立方条图了,我们继续使用我们的乳腺癌数据来制作先把数据导入我们先来看看数据:age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,er表示雌激素原创 2021-04-02 15:32:33 · 8399 阅读 · 30 评论 -
关于文章手把手教你使用stata做竞争风险模型的一些其他操作
我们既往文章《手教你使用stata做竞争风险模型》已经介绍了怎么使用stata做竞争风险模型,有粉丝后台问怎么求总累计复发率,怎么把Y轴改为以百分比形式显示今天我们来实际操作一下,继续使用我们原来文章的数据,具体操作请看原来文章,先做出竞争风险模型,stset etime, failure(status==1)stcrreg treatment, compete(status==2)stcrreg i.treatment, compete(status==2)可以看出3中治疗方法预后原创 2021-03-29 11:01:14 · 2148 阅读 · 2 评论 -
Stata进行logistic回归绘制列线图并做内部验证
我们已经讲过怎么使用R语言进行logistic回归并做内部验证,今天来讲讲怎么使用Stata来做logistic回归并做内部验证,Stata较R来说的优势是操作相对简单,可以界面操作,比SPSS功能又强大一些,废话不多说,进入正题。还是使用既往我们的乳腺癌数据,我们先来看看数据:age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,er表示雌激素受体状态,pr表示孕激素受体状态,status结局事件是否死亡,pathscat表示病理肿原创 2021-02-02 00:47:57 · 10454 阅读 · 2 评论 -
手把手教你使用stata进行cox回归并制作列线图
COX回归是临床常用的一种分析方法,多用于肿瘤、血液等疾病患者,其考虑到了临床随访删失情况,多用与生存分析。前面我们已经多次讲过使用SPSS、和R语言进行COX回归,今天继续来讲讲stata,它相对其他两个软件的优势是比R语言简单,可以界面操作,比SPSS在某方便功能强大一些。首先我们打开stata导入数据,还是原来乳腺癌的数据,我们先来看看数据:age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,er表示雌激素受体状态,pr表示孕原创 2021-01-20 15:54:03 · 12564 阅读 · 22 评论 -
手把手教你使用stata做竞争风险模型
在上一期我们已经介绍了怎么使用R语言做竞争风险模型,今天我们来演示一下怎么使用stata来做竞争风险模型,stata相对r语言来说的优势就是操作相对简单,大部分功能可以通过界面操作来实现,缺点就是界面相对代码不够灵活,但是适合初学者,我们继续使用上次膀胱癌bladder1的数据集来做竞争风险模型,这样可以对比一下stata做出来的结果和R语言有什么不同。先打开stata导入数据,我们的数据不是很大,我就直接复制黏贴进去,下面就是数据的格式,数据的名称解释为:id: 患者编号;treatment(治疗方原创 2021-01-16 14:35:58 · 3844 阅读 · 11 评论 -
手把手教你使用stata导出高清的meta分析tif图片
Stata作为meta分析的工具,有简单、易操作、高效的特点,深受meta初学者欢迎。但是在投稿SCI的时候,大部分期刊都是要求图片为tif格式,分辨率需要在300dpi以上,我们使用stata做出森林图后,大多数人都会直接点保存,如下图:直接使用stata输出的tif文件分辨率非常小,大约只有75dpi作用,远远达不到SCI的要求,编辑们看得都会非常恼火。如下图,编辑直接指出图片质量非常差,一点不客气,要求换图片今天我们来演示一下怎么使用stata做出让编辑满意的森林图,对于其他图片也是同样适用原创 2020-10-26 09:52:37 · 10020 阅读 · 5 评论