分享一篇来自JAMA(IF=51)的NHANES数据插补方法

美国国家健康与营养调查( NHANES, National Health and Nutrition Examination Survey)是一项基于人群的横断面调查,旨在收集有关美国家庭人口健康和营养的信息。
地址为:https://wwwn.cdc.gov/nchs/nhanes/Default.aspx
使用过nhanes数据库的都知道,nhanes数据库有些变量存在大量缺失值,容易导致分析结果偏差,对数据进行插补为一种有效的方法。
在这里插入图片描述
我们在文章《nhanes数据库挖掘教程3–对数据进行多重插补》中已经初步介绍了,近期粉丝向我推荐了一篇JAMA的文献。今天咱们试着复现一下这篇文献的插补方法,并和上面文章的插补方法进行一个对比。
继续使用咱们之前文章《nhanes数据库挖掘教程3–对数据进行多重插补》中采集的nhanes数据,
我们先导入数据

bc<-read.csv("E:/nhanes/nhanes.csv",sep=',',header=TRUE)

在这里插入图片描述
我介绍一下数据,SEQN:序列号,RIAGENDR, # 性别, RIDAGEYR, # 年龄,RIDRETH1, # 种族,DMDMARTL, # 婚姻状况,WTINT2YR,WTMEC2YR, # 权重,SDMVPSU, # psu,SDMVSTRA,# strata,LBDGLUSI, #血糖mmol表示,LBDINSI, #胰岛素( pmmol/L),PHAFSTHR #餐后血糖,LBXGH #糖化血红蛋白,SPXNFEV1, #FEV1:第一秒用力呼气量,SPXNFVC #FVC:用力肺活量,ml(估计肺容量),LBDGLTSI #餐后2小时血糖。
可以看到很多数据存在缺失值

本文为转载文章,全文地址如下:https://mp.weixin.qq.com/s?__biz=MzI1NjM3NTE1NQ==&mid=2247488786&idx=1&sn=098b521e4c80b5c7d02464a019a752e2&chksm=ea26f50edd517c18d99927ab2885658cbe152ab6f4789bf0911d67fa200fe3c3f272260d9890#rd

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值