分享一篇来自JAMA（IF=51）的NHANES数据插补方法

最新推荐文章于 2024-04-13 09:03:39 发布

天桥下的卖艺者

最新推荐文章于 2024-04-13 09:03:39 发布

阅读量1.1k

点赞数

分类专栏： R语言 Nhanes临床数据库文章标签：数据库

原文链接：https://mp.weixin.qq.com/s?__biz=MzI1NjM3NTE1NQ==&mid=2247488786&idx=1&sn=098b521e4c80b5c7d02464a019a752e2&chksm=ea26f50edd517c18d99927ab2885658cbe152ab6f4789bf0911d67fa200fe3c3f272260d9890#rd

版权

R语言同时被 2 个专栏收录

269 篇文章 804 订阅

订阅专栏

Nhanes临床数据库

27 篇文章 60 订阅

订阅专栏

美国国家健康与营养调查（ NHANES, National Health and Nutrition Examination Survey）是一项基于人群的横断面调查，旨在收集有关美国家庭人口健康和营养的信息。
地址为：https://wwwn.cdc.gov/nchs/nhanes/Default.aspx
使用过nhanes数据库的都知道，nhanes数据库有些变量存在大量缺失值，容易导致分析结果偏差，对数据进行插补为一种有效的方法。
在这里插入图片描述
我们在文章《nhanes数据库挖掘教程3–对数据进行多重插补》中已经初步介绍了，近期粉丝向我推荐了一篇JAMA的文献。今天咱们试着复现一下这篇文献的插补方法，并和上面文章的插补方法进行一个对比。
继续使用咱们之前文章《nhanes数据库挖掘教程3–对数据进行多重插补》中采集的nhanes数据，
我们先导入数据

bc<-read.csv("E:/nhanes/nhanes.csv",sep=',',header=TRUE)

在这里插入图片描述
我介绍一下数据，SEQN：序列号，RIAGENDR, # 性别， RIDAGEYR, # 年龄，RIDRETH1, # 种族，DMDMARTL, # 婚姻状况，WTINT2YR,WTMEC2YR, # 权重，SDMVPSU, # psu，SDMVSTRA，# strata，LBDGLUSI, #血糖mmol表示，LBDINSI, #胰岛素( pmmol/L)，PHAFSTHR #餐后血糖，LBXGH #糖化血红蛋白，SPXNFEV1, #FEV1：第一秒用力呼气量，SPXNFVC #FVC：用力肺活量，ml（估计肺容量），LBDGLTSI #餐后2小时血糖。
可以看到很多数据存在缺失值

本文为转载文章，全文地址如下：https://mp.weixin.qq.com/s?__biz=MzI1NjM3NTE1NQ==&mid=2247488786&idx=1&sn=098b521e4c80b5c7d02464a019a752e2&chksm=ea26f50edd517c18d99927ab2885658cbe152ab6f4789bf0911d67fa200fe3c3f272260d9890#rd

天桥下的卖艺者

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享一篇来自JAMA（IF=51）的NHANES数据插补方法

我们在文章《nhanes数据库挖掘教程3–对数据进行多重插补》中已经初步介绍了，近期粉丝向我推荐了一篇JAMA的文献。使用过nhanes数据库的都知道，nhanes数据库有些变量存在大量缺失值，容易导致分析结果偏差，对数据进行插补为一种有效的方法。地址为：https://wwwn.cdc.gov/nchs/nhanes/Default.aspx。继续使用咱们之前文章《nhanes数据库挖掘教程3–对数据进行多重插补》中采集的nhanes数据，可以看到很多数据存在缺失值。
复制链接

扫一扫