R语言手把手带你复现一篇8.5分的charls机器学习文章

写在前面的话:本篇是个合集,因为有多个年度,内容比较多,大概有4篇左右,大概每周1篇左右。这个是一个完整的独立的charls机器学习文章复现教程,,从数据下载到数据分析全流程,因为要照顾一些新手和文章的完整性,会从基线数据下载,多年数据整理合并开始说,可能会和前面得一些教程有点重合,这也是没办法的事,注意衡量取舍一下,别到时说我凑字数,凑文章,最后说明下我只是复现一个思路,不能解决你所有问题,只是开启思路,达到抛砖引玉的目的。

应粉丝要求,本次复现一篇charls的文章名字《甘油三酯葡萄糖-腰身高比指数与中国中老年人心血管疾病的关系: 一项全国性队列研究》(Association between triglyceride glucose-waist height ratio index and cardiovascular disease in middle-aged and older Chinese individuals: a nationwide cohort study (CHARLS)),

在这里插入图片描述
这是一篇去年的比较新的文章,我查了下大概8.5分,文章大概就是介绍一种指数,叫做:甘油三酯葡萄糖-腰身高比指数(cumulative_TyG_WHtR),研究甘油三酯葡萄糖-腰身高比指数和新发心血管疾病的关系,作者搞了个K值聚类分析来把cumulative_TyG_WHtR指数分类,研究分类后指标和心血管疾病关系,

在这里插入图片描述
在这里插入图片描述

这样类似的指数还有很多,比如TYG,WHtR,TyG_WHtR,目前这是一个发文的方向,这样的指数,变一个结局变量,又可以继续搞一篇文章,很多类似文章层出不穷,nhanes也有很多,

比如下面这篇就是介绍甘油三酯葡萄糖-腰身高比指数和高血压病的关系,就是换了个结局,心血管换成高血压,方法几乎一模一样。

在这里插入图片描述

下面这篇则是分类更详细,研究的是动脉粥样硬化性心血管疾病的相关性

在这里插入图片描述
目前到了charls这里变了个玩法,加上了机器学习,好像又厉害了一点,其实都是差不多的玩法。我间断花了4-5天整理,我反复揣摩作者的想法比对了数据和结果,主要介绍的是作者的一个思路,并且介绍如何把这些表格做出来。并不是一比一还原这篇文章,作者做了大量的工作,我主要是把的想法和思路展现出来。

下载和整理数据分成两个章节,1是下载2011年的基线数据,2.是把2013年、2015年,2018年、2020年的数据和2011年的数据进行合并。本节主要是下载2011年的基线数据,可能会和前面有点重合,但是也有一些新的东西。作者做了很多筛选,有些是流程图没有,但是文章有,这个也是要兼顾到的。

OK,下面正式开始介绍,首先咱们看下作者的是怎么进行研究的,研究的是:甘油三酯葡萄糖-腰身高比指数与中国中老年人心血管疾病的关系,这个是个复合指数,含有多年的时间数据,所以,咱们要先看先作者的研究思路,先要看作者的流程图

完整文章请看下面这篇文章:

R语言手把手带你复现一篇8.5分的charls机器学习文章

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

天桥下的卖艺者

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值