了解NHANES数据库的人都知道,它是一项全美范围内的横断面调查,但是小编之前也分享过一篇使用NHANES数据开展前瞻性队列研究的文献,今天跟大家分享一下如何获取一份利用nahens数据开展队列研究所需要的随访结果!
1、打开死亡数据链接
https://www.cdc.gov/nchs/data-linkage/mortality.htm
打开后点击Public-Use Files
2、下载Public-Use 2015 LMF和Sample R program文件
Public-Use 2015 LMF:字典,内有每个字段的相应解释
Sample R program:用于死亡数据注释的R代码,也支持SAS和Stata,下载对应文件即可
3、点击死亡数据下载网址(FTP Site)
根据需要下载对应年份的数据,这里小编下载2013-2014的数据,则随访时间为1年(需要注意的是,死亡数据只更新到2015年为止,所以大家如果要利用nhanes做队列研究,只能下载2015年以前的数据)
4、此时文件夹里多了3个文件,依次是死亡数据,字典,以及R代码
5、注释死亡数据文件
(1)用R打开R_ReadlnProgramAllSurveys.R文件
(2)代码从57行开始(选中相应代码,点击Run可直接运行),跑完65行看下文选择相应版本代码后再继续运行
(3)选择注释代码版本
官方直接下载的R代码里包括了两个版本的注释代码:NHIS VERISON和NHNES VERISON。
小编下载的是NHNES版本的数据,文件注释代码选择NHANES VERISON(从164行代码开始)
只需要正确修改167和168行的文件名就行,改完这2行后,可将后续代码全部选中,然后点击Run,这样就完成了死亡数据文件的注释
如果下载的是NHIS版本的数据就从72行跑到157行就结束(也只需要注意命名一下72行和73行的文件名)
6、变量解释可以参考Public-Use 2015 LMF文件(也就是字典)
注释后的死亡数据根据SEQN字段就可以和相应年份的其他数据合并了,这样就得到了一份可以开展队列研究的数据了!