r语言 逻辑回归预测特定值的概率_R语言可视化探索BRFSS数据并逻辑回归Logistic回归预测中风...

原文链接:

http://tecdat.cn/?p=9195​tecdat.cn

加载包

library(ggplot2)

载入资料

load("brfss2013.RData")

第1部分:关于数据

行为风险因素监视系统(BRFSS)是美国的年度电话调查。BRFSS旨在识别成年人口中的危险因素并报告新兴趋势。例如,询问受访者饮食和每周的体育锻炼,艾滋病毒/艾滋病状况,可能的烟草使用,免疫接种,健康状况,健康天数-与健康相关的生活质量,获得医疗保健,睡眠不足,高血压意识,胆固醇意识,慢性健康状况,饮酒,水果和蔬菜消费,关节炎负担和安全带使用。

数据采集​​:

数据收集过程在brfss_codebook中进行了说明。通过进行座机电话调查和基于蜂窝电话的调查,从美国所有50个州,哥伦比亚特区,波多黎各,关岛和美属萨摩亚,密克罗尼西亚联邦和帕劳收集了数据。固定电话样本已使用了不成比例的分层抽样(DSS),并且随机选择了蜂窝电话受访者,每个受访者具有相同的选择概率。我们正在处理的数据集包含330个变量,2013年共进行491、775次观测。缺失值用“ NA”表示。

推广性:

样本数据应使我们能够推广到感兴趣的人群。它是对491,775名18岁以上美国成年人的调查。它基于大量分层的随机样本。潜在偏见与无回应,不完整的访谈,价值观缺失和便利偏见有关。

因果关系:

BRFSS是一项观察研究,只能建立变量之间的相关性/关联性,因此无法建立因果关系。

第2部分:研究问题

研究问题1:

在过去30天内,身心健康状况不佳的天数分布是否因性别而异?

研究问题2:

受访者接受采访的月份与受访者自我报告的健康感知之间是否存在关联?

研究问题3:

收入和医疗保险之间有关联吗?

研究问题4:

吸烟,饮酒,胆固醇,血压,体重和中风之间是否有任何关系?最终,我想看看是否可以通过上述变量预测中风。

第3部分:探索性数据分析

研究问题1:


  1. ggplot(aes(x=physhlth, fill=sex), data = brfss2013[!is.na(brfss2013$sex), ]) +

  2. geom_histogram(bins=30, position = position_dodge()) + ggtitle('Number of Days Physical Health not Good in the Past 30 Days')

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值