认识MASS扩展包中的birthwt 数据集

 下面内容摘录自《用R探索医药数据科学》专栏文章的部分内容。

1)栏目后续章节的文章将深入概括R语言在临床研究和新药创新领域的应用,填补了国内R教材中尚未广泛覆盖的部分内容。

2)专栏每篇文章都在 5000 字以上,质量平均分高达 94 分。已发表章节也会增加新的文章,已发表的文章也会更新版本,可留意专栏内容和题目信息。

3)由于每结束一个章节,专栏的优惠力度就会减小,当下正是订阅的最佳优惠时段,诚邀各位积极订阅!看全文请点击下面链接。

6章2节:认识birthwt数据集,EpiDisplay和Gmodels扩展包的应用-CSDN博客文章浏览阅读3次。在本节内容里,我们将对 birthwt 数据集进行深入探讨。与此同时,向大家介绍 R 语言的 epiDisplay 扩展包。此包堪称功能强大的工具,主要用于流行病学数据的描述性分析与可视化。它为用户提供了众多简便易用的函数,可用于生成频数表、计算百分比以及绘制图形等。最后,再为大家介绍一下 gmodels 扩展包。https://blog.csdn.net/2301_79425796/article/details/141645543

欢迎订阅我们专栏

.......前面部分请点击上面链接看原文(原文5315字)

在 R 语言的广泛应用领域中,数据集的选择与理解起着至关重要的作用。它既为学习 R 语言奠定了基础数据,又为我们开展统计分析和模型构建提供了强有力的支持。鉴于此前我们的众多案例以及未来的章节中都在很大程度上使用了 birthwt 数据集,在本节内容里,我们将对 birthwt 数据集进行深入探讨。与此同时,向大家介绍 R 语言的 epiDisplay 扩展包。此包堪称功能强大的工具,主要用于流行病学数据的描述性分析与可视化。它为用户提供了众多简便易用的函数,可用于生成频数表、计算百分比以及绘制图形等。最后,再为大家介绍一下 gmodels 扩展包。若需了解更多扩展包的细节用法,请自行阅读相关的扩展包使用说明。

一、认识birthwt 数据集

Birthwt数据集是R语言中MASS扩展包中的一个重要数据集,源自于1986年马萨诸塞州斯普林菲尔德的湾州医疗中心(Baystate Health)的189例分娩数据。该数据集包含了189行和10列,记录了母亲的健康状况、生活习惯以及新生儿的出生体重等信息。它在生物统计学和流行病学研究中具有重要的应用价值,特别是用于研究影响新生儿低出生体重的因素。

首先,我们需要了解birthwt数据集中的各个变量。下表列出了这些变量的名称、描述以及取值范围。

变量名称变量描述取值范围
low新生儿体重是否小于2.5公斤0(否), 1(是)
age母亲的年龄(年)连续型变量
lwt母亲在最后一次月经期间的体重(磅)连续型变量
race母亲的种族1(白人), 2(黑人), 3(其他)
smoke怀孕期间吸烟0(无), 1(有)
ptl以前早产的次数0, 1, 2, 3
ht是否有高血压病史0(无), 1(有)
ui是否存在宫腔疼痛0(无), 1(有)
ftv怀孕前三个月的就诊次数0, 1, 2, 3, 4, 6
bwt新生儿出生体重(克)连续型变量

上面表格,第一个属性就是低出生体重变量,它是二元变量用于识别低体重案例且与婴儿死亡率等相关;接着,母亲的年龄是连续变量,其大小可能影响怀孕结果;母亲的体重以磅为单位,过高或过低会影响怀孕及新生儿体重;母亲种族是分类变量,与健康和社会经济地位有关;怀孕期间吸烟情况是二元变量,吸烟增加低出生体重风险;以前早产次数是离散型变量,可评估再次早产风险;高血压病史记录母亲是否有高血压,会增加妊娠并发症风险;宫腔疼痛是与妊娠并发症相关指标;怀孕前三个月就诊次数是离散型变量,与孕期管理和并发症风险相关;新生儿出生体重是连续型变量的目标变量,衡量新生儿体重。

二、EpiDisplay扩展包

R语言中,epiDisplay包是一个功能强大的工具包,主要用于流行病学数据的描述性分析和可视化。该包为用户提供了多种易于使用的函数,以便生成频数表、计算百分比、以及绘制图形等。本文将深入探讨epiDisplay包中的一些关键函数,包括tab1()tabpct(),并展示如何在实际数据分析中应用这些函数来生成有意义的统计图表。我们还将介绍gmodels包中的CrossTable()函数,并对其与epiDisplay包的功能进行对比分析。

  ........

欢迎订阅我们专栏,深度系统地学习R语言。 

为帮助大家更出色地掌握临床统计、数据挖掘以及人工智能建模的入门知识和应用,由于众多同学在计算机编程上经验欠缺,特此开设《用R 探索医药数据科学》专栏。该专栏每周至少会定期更新三篇,直到整个专栏更新完成。每篇文章都在 5000 字以上,质量平均分高达 94 分。还要提醒大家的是,每结束一个章节,专栏的优惠力度就会减小,当下正是订阅的最佳优惠时段,诚邀各位积极订阅!

专栏《用R 探索医药数据科学》链接:https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482

​​​

  • 9
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

数据科学和人工智能兴趣组

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值