一、REDCap是什么?
REDCap(Research Electronic Data Capture)是一款专为非营利组织设计的电子数据采集软件,由Vanderbilt大学开发。尽管REDCap软件可以免费使用,但它并非开源软件。为了使用REDCap,您的机构需要加入REDCap联盟,并签署最终用户许可协议(EULA)。
1、加入REDCap联盟的要求
加入REDCap联盟需要在线提交一份标准的最终用户许可协议。该协议必须在Vanderbilt大学与您的机构之间正式签署。为了确保许可提交顺利,请事先与以下部门协调:技术转让部门、法务部门、IT部门等。
签署许可协议后,您的机构将获得REDCap源代码的访问权限。需要注意的是,尽管REDCap免费提供,但它并不是开源软件。更多详情请参考FAQ部分的“REDCap是开源软件吗?”提交许可协议之前,请仔细阅读相关信息,并完成资格调查问卷。如果符合条件,系统将生成正式的许可链接供您提交。
REDCap的运行需要满足特定的IT基础设施要求,例如:PHP Web服务器、MySQL数据库服务器等。根据许可条款,所有技术支持必须由机构内部的IT部门提供。禁止外包支持服务(包括非正式的志愿者支持)。技术支持人员必须是机构的正式员工,而非第三方服务提供商。
建议机构内部指定一名或多名管理员,为REDCap用户提供日常非技术性支持。这可以显著提高系统的使用效率和用户体验。
2、加入REDCap联盟之后
加入REDCap联盟后,您将获得访问专属在线门户 Community 的权限。该门户为联盟成员提供:内部知识库、技术文档 和 支持资源。
REDCap联盟定期举办网络研讨会,涵盖以下主题:软件故障排查、新功能开发与优先级讨论 和 技术支持与教育机会。
通过Community平台、研讨会和年度线下活动 REDCapCon,联盟成员可以共同开发新模块、改进文档、优化项目管理模式,并为新成员提供支持。这种全球协作是REDCap成功的关键所在。
许可证提交步骤,在提交之前,请认真阅读REDCap最终用户许可协议的条款和条件。根据问卷结果,系统会生成正式的许可链接(若不符合条件,系统将提供其他使用建议)。按照指引完成许可协议的提交流程。如有疑问,请联系Vanderbilt REDCap团队:redcap@vumc.org。
3、REDCap 提供的功能
REDCap 提供多样化的功能和强大的灵活性,适用于各种规模的研究项目。用户可以通过 在线设计器 或 离线数据字典模板 快速创建问卷或数据库,从项目构想到生产级应用通常仅需一天。REDCap 为用户提供完全自主的项目管理能力,包括用户权限分配、问卷自定义和项目日志记录等功能。它还支持多机构合作,研究人员可以跨站点共享数据库,适用于多中心研究项目。
REDCap 的功能高度丰富,能够满足研究数据管理的各种需求。它内置了数据验证逻辑、逻辑分支、计算字段等高级功能,帮助用户实现动态的数据采集与管理。同时,系统支持自动化数据导出,可以轻松生成 Excel、PDF 报告,或直接与 SPSS、SAS、Stata、R 等统计工具对接。除了内置的项目日历、排期模块和报告工具外,REDCap 还支持文件上传功能,全面提升数据管理的便捷性。此外,通过强大的审计日志,用户可以清晰追踪所有数据操作和用户活动,确保研究过程透明合规。
安全性和合规性是 REDCap 的核心优势之一。系统支持安装在满足多种国际标准(如 HIPAA、21 CFR Part 11、FISMA)的环境中,并通过 FHIR 接口与电子健康记录(EHR)系统实现互操作性,确保医疗数据的安全传输与整合。REDCap 提供了跨平台支持,包括 iOS 和 Android 移动应用,用户可随时随地进行数据采集与管理。作为一款开源工具,REDCap 已支持多种语言,包括中文、法语和德语等,同时欢迎合作伙伴贡献更多语言版本。如果你对这款高效、安全的工具感兴趣,可以通过官网加入 REDCap 合作联盟,开启便捷的数据管理之旅!
4、再谈谈REDCap 联盟
在 REDCap 软件开发团队的工作基础上,一个强大的专家网络正在持续发挥重要作用,这便是 REDCap 联盟(REDCap Consortium)。作为一名新加入的 REDCap 授权合作伙伴和软件管理员,您将获得一套完善的支持系统,不仅有助于管理本地的 REDCap 部署,还能支持您的机构用户和协作伙伴。
REDCap 联盟的成员由来自世界各地的志愿者组成,他们每天为管理者们的各种问题提供免费支持。这些问题既包括常见的管理问题,也涉及更复杂的技术挑战。联盟成员的协作模式非常高效,他们定期交流经验、分享知识,无偿贡献自己的专业技能,形成了一个互助共赢的社区。
这些志愿者还通过以下方式为联盟提供支持:
- 年度会议中的领导作用:担任会议主持人或小组委员会成员,积极推进项目进展。
- 参与专门项目小组:定期参与网络研讨会,讨论研究应用案例、开发工具或新功能。
- 贡献工具和材料:共享开发的 REDCap 数据采集工具、培训材料以及自定义的外部模块。
- 测试与反馈:为软件的测试、新功能和新应用提供重要反馈意见。
联盟成员的背景多种多样,既包括为本机构提供管理支持的非技术型人员,也包括在研究信息学领域处于领先地位的技术专家。正因如此,REDCap 联盟被誉为一个独特的、充满热情且关怀的集体,他们致力于推动 REDCap 的使命。联盟欢迎所有成员,无论角色大小,都可以在社区中既作为“消费者”也作为“贡献者”积极参与。
Vanderbilt 团队提供的支持资源
作为 REDCap 的发源地,Vanderbilt 团队为联盟成员提供了一系列支持工具,以帮助管理员和用户更好地使用 REDCap 系统,包括:一个知识管理平台,包含软件下载、重要文档、支持问答等内容,仅限已注册的管理员访问。会议内容涵盖最新的 REDCap 动态、操作演示、使用案例分享等,由 Vanderbilt 团队及联盟成员主讲。每周一次的专门会议,针对管理员的具体问题,由 REDCap 首席开发人员提供深入的技术指导。为各委员会和小组的任务和目标提供组织支持。提供团队建设、网络交流和学习机会。通过 redcap@vumc.org 获取专属资源的支持。针对 REDCap 移动应用的技术支持,可通过 redcapapp@vumc.org 联系。
二、REDCap能做什么?
1、REDCap基础环境
围绕REDCap的安全性很大程度上与REDCap软件本身无关,而是依赖于REDCap安装所在的IT基础设施和环境。这包括Web服务器和数据库服务器、这两个服务器之间的通信,以及Web服务器与REDCap最终用户的通信。典型的最佳实践是Web服务器和数据库服务器应该是两个独立的服务器,并且数据库服务器应该安全地位于防火墙后面。Web服务器可以位于防火墙后面或DMZ(非军事区)。许多机构(包括范德堡大学)将Web服务器托管在DMZ中,以便它在防火墙外对整个互联网可用。为了与最终用户保持安全通信,需要在Web服务器上使用SSL,因此Web服务器必须设置有SSL证书。关于REDCap的数据备份,大多数托管REDCap的机构通常会每天(或每天两次)备份他们的REDCap数据库表,通常使用mysqldump或其他类似软件。REDCap对服务器处理能力、内存或硬盘空间没有硬性要求,因为它在大多数方面都非常轻量级,并且对Web服务器或数据库服务器的初始驱动空间要求非常少。通常建议最初为Web服务器和数据库服务器各分配10GB。对于大多数机构来说,即使在重负载下运行REDCap,这个存储空间通常也足够使用第一年(或更长时间)。由于所有机构和用户都不同,REDCap随时间消耗的硬盘空间并不总是可预测的,但在经过几个月的日常REDCap用户稳定使用后,随时间消耗的空间量变得相当可预测。如果Web服务器可以被Web访问(即在DMZ中),则建议REDCap中的文件不要存储在Web服务器上,而是存储在防火墙后面的另一个服务器上(类似于数据库服务器)。无论您是在典型的文件服务器、网络附加存储(NAS)还是网络文件系统(NFS)上存储REDCap文件,最安全的地方是使用WebDAV协议(SSL支持)通过安全通信存储在防火墙后面,REDCap控制中心有一个选项可以启用WebDAV选项。如果Web服务器位于防火墙后面且不可供Web访问(即不在DMZ中),那么将REDCap文件存储在本地Web服务器或挂载到Web服务器的文件系统上可能完全没有问题。无论您的设置如何,您应该首先咨询您机构的政策,看看是否有任何关于文件存储的机构规定或要求(特别是涉及包含识别信息的文件——例如PHI),然后再最终确定您的生产REDCap环境。
安装REDCap的基础设施要求和依赖性列表相当短。REDCap可以在许多不同的操作系统上运行(Linux、Unix、Windows、Mac)。REDCap唯一的要求是必须安装以下硬件和软件。(注:所有必需的软件都是开源的。)
- 带有PHP 7.2.5及以上版本的Web服务器(例如Microsoft IIS或Apache)。
- 带有MySQL 5.5.5+或MariaDB 5.5.5+的数据库服务器。 a. MySQL客户端——安装/升级必需(例如phpMyAdmin、MySQL Workbench)。
- SMTP电子邮件服务器——为了从REDCap发送电子邮件,必须在Web服务器上配置SMTP服务器与PHP一起使用。它可以安装在同一个Web服务器上,或者安装在单独的服务器上(更推荐),例如现有的机构SMTP服务器(如果可用)。
- 文件服务器(可选)——根据您的基础设施和设置,您可能希望使用一个单独的服务器仅用于上传/存储在REDCap中的文件。如果您的Web服务器可以被Web访问(即在DMZ中),强烈建议有一个单独的文件服务器位于防火墙后面,使用WebDAV协议(SSL支持)安全地与REDCap通信。首先咨询您当地的政策,以防您的机构对此有规定或要求。
2、REDCap认证
REDCap实施认证以验证登录系统的最终用户的身份。REDCap有几种认证方法可供使用:LDAP、Shibboleth、OpenID、Google OAuth2,以及内部基于表格的认证方法,还可以结合LDAP和基于表格的方法。运行REDCap的机构可以选择对他们来说最有效的认证方法。基于表格的认证,它使用数据库表中存储的用户名/密码对,通常是最容易设置的,因为它是内置的,不需要设置和配置外部服务即可操作。出于安全原因,数据库表中的密码不是以明文存储的,而是首先使用SHA-512加密哈希函数进行加盐哈希,然后存储在数据库表中。同样值得注意的是,每个用户账户都有自己的唯一盐值。REDCap包含一个可定制的自动注销设置(默认自动注销时间为30分钟),如果用户在当前网页上没有任何活动(例如点击、打字、移动鼠标),系统将在设定的时间后自动将用户从系统中注销。这可以防止其他人在他们离开工作站时没有正确注销或关闭浏览器窗口而访问他们的账户和项目数据。还有一些可定制的设置管理登录活动,例如可以手动设置在用户被锁定系统指定时间之前失败的登录尝试次数。还有一个用户挂起状态,可以为任何给定的用户设置。挂起用户允许他们保持系统中的用户,但拒绝他们访问整个REDCap应用程序,直到他们的挂起状态被撤销。出于各种原因,挂起用户比从系统中永久删除用户更可取。还有一些特定于基于表格认证的安全设置。这些包括允许用户设置自己的密码,并在需要时阻止他们重用最近的密码。用户也可以在指定的天数后自动被迫更改密码。如果使用LDAP或Shibboleth认证,系统可以设置为允许任何和所有用户能够自动创建自己的REDCap账户,或者相反,这些用户只能在管理员首先将他们添加到用户白名单后才能访问REDCap。通过这种方式,本地REDCap管理员可以选择他们希望对新用户如何获得REDCap访问权限更加或更少的限制。通过在REDCap中启用双因素认证,可以提高与认证相关的安全性。双因素认证(有时称为两步登录)是REDCap的一个可选设置,可以在控制中心启用。一旦启用,双因素认证要求用户在登录过程中执行一个额外的步骤。有几种可用的选项,例如用户必须输入通过电子邮件获得的6位代码,通过SMS短信获得,或通过移动设备上的Google Authenticator应用程序获得。另一个选项是使用Duo应用程序,如果机构已经使用Duo双因素认证。
3、REDCap日志记录和审计追踪
REDCap内置了审计追踪功能,自动记录所有用户活动和每个用户查看的所有页面,包括上下文信息(例如被访问的项目或记录)。无论是输入数据、导出数据、修改字段、运行报告,还是添加/修改用户等众多其他活动,REDCap都会记录所有操作。日志记录本身可以在项目内由被授权查看日志页面的用户查看。日志页面允许这些用户查看或导出该项目的整个审计追踪,并根据活动类型和/或用户以各种方式过滤审计追踪。REDCap内置的审计追踪功能使管理员能够确定任何给定用户查看或修改的所有活动和所有数据。
4、REDCap数据导出和去识别化
REDCap允许用户从他们的REDCap项目中导出任何和所有数据,前提是他们被授予了完整的数据导出权限。数据可以以各种方式和各种格式导出。数据可以作为CSV(逗号分隔)文件从报告中导出,也可以在查看特定记录时以PDF文件的形式从数据输入页面导出。数据导出工具页面允许用户将项目收集的数据导出为CSV文件,该文件可以在Excel或几种流行的统计分析软件包中打开,如SAS、SPSS、Stata和R。也可以使用REDCap API从项目中导出数据,该API可以以几种格式(CSV、JSON或XML)导出数据。数据导出工具具有高级导出功能,允许实施数据去识别化方法,例如能够自动删除自由文本字段、删除日期、执行日期偏移,并从用户导出的数据文件中删除标记为标识符的字段(例如PHI)。用户权限也可以设置,以便一些用户可以从项目中导出数据,但将数据去识别化方法作为防止他们导出敏感数据的手段,无论是意外还是故意的。
5、REDCap数据存储
REDCap将其数据和所有系统和项目信息存储在单个MySQL数据库的各种关系数据库表中(即使用外键和索引),这是一个开源的关系数据库管理系统(RDBMS)。REDCap的前端是用PHP编写的,PHP是一种广泛使用、健壮的开源Web应用程序脚本语言。设置Web服务器和数据库服务器以及保护服务器之间的通信和最终用户的通信是安装REDCap的合作机构的责任,因此必须在安装REDCap之前完成。安装REDCap的机构将在其自己的服务器上存储REDCap捕获的所有数据。因此,所有项目数据都存储并托管在该当地机构,REDCap从未在任何时候将项目数据从该机构传输到另一个机构或组织。REDCap的本地网页编码和数据库存储校对是UTF-8,允许在REDCap中存储的用户定义文本中使用非英语语言。这包括为项目输入的数据或为调查问题或数据库字段标签定义的文本等许多其他类型的用户定义文本。REDCap的数据库表实现了MySQL的Innodb存储引擎,允许使用外键进行引用完整性、事务和行级锁定(而不是表级锁定),所有这些都是REDCap为了一致性、性能和可扩展性所需的。REDCap不使用数据库服务器上的数据加密(即“静态”加密)。(这不要与通过SSL传输到数据库的数据加密混淆,这应该始终完成,并且必须由合作机构设置。)如果数据库服务器得到适当保护,就不需要对数据库数据进行加密。然而,一些机构或合规办公室要求加密。在这些情况下,合作机构被鼓励寻求文件系统级加密解决方案或数据库级加密解决方案。目前,数据库级静态数据加密有两个选项:
MariaDB 10.1.3+支持加密(使用Google补丁)。
MySQL 5.7.11+(和Percona Server 5.7.11)有InnoDB表空间级加密。
所有在REDCap中上传和/或存储的文档将存储在本地REDCap Web服务器上,在挂载到Web服务器的本地文件服务器上,或使用WebDAV协议(SSL支持)的单独服务器上。在REDCap的旧版本中,一些类型的文件存储在数据库表中,但不再这样做。存储在REDCap中的文件不是以加密格式存储,而是以其原始形式(尽管在不同的文件名下)存储。如果合作机构选择在本地Web服务器上存储REDCap文件,强烈建议将文件存储在不可供Web访问的 secure directory中(即不在Web根目录下)。
6、REDCap安全
为了帮助保护和确保存储在REDCap后端数据库中的数据安全,软件应用程序采用了各种方法来保护免受可能尝试识别和利用系统中任何安全漏洞的恶意用户的攻击。这些方法将在技术细节上描述。在REDCap中,所有传入数据都经过有意的过滤、消毒和转义。这包括所有通过HTTP Post请求提交的数据和用户访问REDCap时在每个URL中找到的所有查询字符串数据,以及其他用户定义的数据提交方式。易受最终用户伪造的服务器环境变量也经过检查和消毒。所有用户提交的数据都经过适当的过滤,以去除任何可能有害的标记标签(例如<script>),然后在显示在应用程序内的Web页面之前进行转义。从REDCap发送到数据库服务器的SQL查询在发送之前都经过适当的转义。如果SQL查询中使用的任何值源自用户定义的值,它们也将事先经过消毒,如上所述。用于SQL查询的用户定义数据会检查数据类型以防止数据类型不匹配(例如确保数字确实是数字)。这些消毒、过滤、数据类型检查和转义的过程都有助于防止攻击方法,如跨站脚本攻击(XSS)和SQL注入。为了特别防止跨站请求伪造(CSRF),REDCap在应用程序中使用的每个Web表单上使用“nonce”(一个秘密的、用户特定的令牌)。nonce是为每个新的HTTP请求在每个REDCap会话中生成的唯一值。此外,REDCap在其Web页面上采用“速率限制”,允许每个IP地址每分钟有设定的最大Web请求数量,超过该最大值后,该用户的IP地址将被永久禁止使用REDCap。每个IP地址每分钟的请求速率限制值是可定制的,并且可以在REDCap的控制中心内修改,如果需要的话。速率限制可以防止由机器人发起的拒绝服务攻击,以及防止其他需要在短时间内向服务器发出许多请求的黑客攻击,例如BREACH攻击。关于特别防止BREACH攻击,除了使用速率限制外,REDCap还在每个Web页面上输出一个不可见的随机文本字符串,长度随机,作为一种有效的技术来减轻此类攻击。REDCap在每个Web表单上使用独特的nonce令牌也大大降低了BREACH攻击的可能性。许多安装REDCap的机构已经使用企业级Web应用程序安全扫描器扫描和测试REDCap的安全性及其承受各种攻击方法的能力。REDCap在这种情况下表现非常好。任何希望使用安全扫描软件扫描REDCap的合作机构都可以自由地这样做,而无需范德堡大学或REDCap开发者的同意,只要被扫描的REDCap实例是他们自己的,并且不是由另一个机构/组织托管的。如果一个机构决定对REDCap进行安全扫描,并发现任何直接与REDCap相关的中高风险安全问题,他们被鼓励联系范德堡的REDCap开发者,以便这些问题可以立即得到解决。关于REDCap使用的cookie的安全性,由REDCap创建的所有会话cookie和其他与认证相关的cookie将自动将“HttpOnly”属性设置为TRUE。默认情况下,“Secure”cookie标志将设置为FALSE。虽然这稍微不太安全,但将其值设置为TRUE有时会导致某些服务器配置的登录问题,例如反向代理。因此,出于兼容性原因,默认设置为FALSE。然而,任何机构都可以通过在REDCap Web服务器的PHP.INI配置文件中设置session.cookie_secure=On来启用会话cookie的“Secure”标志以提高安全性。
7、数据互操作性
REDCap具有用于轻松导出和导入数据的模块,这些模块对于通过Web界面手动将数据导入和导出REDCap非常有用。但由于各种原因,有时需要能够以自动化或程序化的方式在系统之间迁移数据。REDCap有能力使用几种不同的方法将数据移入和移出各个REDCap项目,这些方法不需要Web界面。REDCap API是一个接口,允许外部应用程序远程连接到REDCap,并用于以程序化方式检索或修改REDCap内的数据或设置。这包括从指定的REDCap项目中执行自动化数据导入/导出,导入/导出项目元数据(即数据字典),事件。甚至还有一个API方法用于创建全新的项目。API是REDCap的内置功能,因此不需要安装。REDCap API使用令牌作为验证和验证所有收到的API请求的手段。类似于REDCap Web界面中的数据导入工具,API在用于数据导入目的时也实现数据验证,以确保只有有效的数据被存储。API提供了一种非常高效的方式,可以轻松地将数据移动到另一个系统或从另一个系统移动数据。REDCap可以利用的另一个数据互操作性服务是动态数据拉取(DDP)模块。DDP是一个特殊功能,用于从外部源系统导入数据到REDCap。它提供了一个裁决过程,REDCap用户可以在其中批准来自源系统的所有传入数据,然后才正式保存在他们的REDCap项目中。虽然主要的DDP模块预安装在REDCap中,但托管机构需要创建至少两个Web服务作为中间件,以便REDCap可以使用这些服务与数据源系统进行通信,反之亦然。DDP仅支持从源系统导入数据到REDCap(而API支持数据导入和导出)。由于DDP假设来自源系统的所有传入数据可能不可信或只有数据的一个子集需要从源系统导入,DDP在REDCap的Web界面中使用一个裁决Web页面,最终用户可以在其中审查从源系统获得的数据,然后确认将其导入他们的REDCap项目。DDP可以立即实时从源系统获取数据,只要输入记录标识符(例如,病历号)。它还有一个辅助的cron作业,每天运行一次,获取可能已输入源系统的任何新数据。
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。同时,它们也缺乏针对医药领域的深度结合与讨论。为了解决这些痛点,我们推出了《用 R 探索医药数据科学》专栏。该专栏将持续更新,不仅为您提供系统化的学习内容,更致力于成为您掌握最新、最全医药数据科学技术的得力助手。
- 每篇文章篇幅在5000字 至9000字之间。
- 内容涵盖试验统计、预测模型、科研绘图、数据库、机器学习等热点领域。
《用 R 探索医药数据科学》专栏目录(截止11月份19日)
第一章:认识数据科学和R
1章1节:医药数据科学的历程和发展,用R语言探索数据科学(更新20241029)-CSDN博客
1章2节:机器学习、统计学与ChatGPT的概述,与R语言的相关 (更新20241229)_ai、chatgpt和机器学习什么关系-CSDN博客
1章3节:R 语言的产生与发展轨迹(更新2024/08/14)-CSDN博客
1章4节:数据可视化, R 语言的静态绘图和 Shiny 的交互可视化演示(更新20240814)-CSDN博客
第二章:R的安装和数据读取
2章1节:R和RStudio的下载和安装(Windows 和 Mac)-CSDN博客
2章2节:RStudio 四大区应用全解,兼谈 R 的代码规范与相关文件展示_rstudio的console和terminal-CSDN博客
2章3节:RStudio的高效使用技巧,自定义RStudio环境(更新20241023)_rstudio如何使用-CSDN博客
2章4节:用RStudio做项目管理,静态图和动态图的演示,感受ggplot2的魅力-CSDN博客
2章5节:详解R的扩展包管理(从模糊安装到自动更新)及工作目录和工作空间的设置(更新20241030 )-CSDN博客
2章6节:R的数据集读取和利用,如何高效地直接复制黏贴数据到R(20240807 )_r语言 复制数据集-CSDN博客
2章7节:读写RDS,CSV,TXT,Excel,SPSS、SAS、Stata、Minitab等的数据文件(更新20240807)_r语言读取rds文件-CSDN博客
2章8节:一文学会 R Markdown 的文档核心操作,切记文末有R资源的分享_r markdown文件(.rmd)-CSDN博客
2章9节:认识R与数据库连接和网络爬虫,学会在R中使用SQL语言_sql和r语言-CSDN博客
2章10节:用 R 直接下载并分析 NHANES 数据库的数据,文末示例自创便捷下载函数(更新20240807)_nhanes数据分析-CSDN博客
第三章:认识数据
3章1节:数据的基本概念以及 R 中的数据结构、向量与矩阵的创建及运算-CSDN博客
3章2节:继续讲R的数据结构,数组、数据框和列表-CSDN博客
3章3节:R的赋值操作与算术运算_r里面的赋值-CSDN博客
第四章:数据的预处理
4章1节:全面了解 R 中的数据预处理,通过 R 基本函数实施数据查阅_r数据预处理-CSDN博客
4章2节:从排序到分组和筛选,通过 R 的 dplyr 扩展包来操作-CSDN博客
4章3节:处理医学类原始数据的重要技巧,R语言中的宽长数据转换,tidyr包的使用指南-CSDN博客
4章4节:临床数据科学中如何用R来进行缺失值的处理_临床生存分析缺失值r语言-CSDN博客
4章5节:数据科学中的缺失值的处理,删除和填补的选择,K最近邻填补法-CSDN博客
4章6节:R的多重填补法中随机回归填补法的应用,MICE包的实际应用和统计与可视化评估-CSDN博客
4章7节:用R做数据重塑,数据去重和数据的匹配-CSDN博客
4章8节:用R做数据重塑,行列命名和数据类型转换-CSDN博客
4章9节:用R做数据重塑,增加变量和赋值修改,和mutate()函数的复杂用法_r语言如何在数据集中添加变量-CSDN博客
4章10节:用R做数据重塑,变体函数应用详解和可视化的数据预处理介绍-CSDN博客
4章11节:用R做数据重塑,数据的特征缩放和特征可视化-CSDN博客
4章12节:R语言中字符串的处理,正则表达式的基础要点和特殊字符-CSDN博客
4章13节:R语言中Stringr扩展包进行字符串的查阅、大小转换和排序-CSDN博客
4章14节:R语言中字符串的处理,提取替换,分割连接和填充插值_r语言替换字符串-CSDN博客
4章15节:字符串处理,提取匹配的相关操作扩展,和Stringr包不同函数的重点介绍和举例-CSDN博客
4章16节:R 语言中日期时间数据的关键处理要点_r语言 时刻数据-CSDN博客
第五章:定量数据的统计描述
5章1节:用R语言进行定量数据的统计描述,文末有众数的自定义函数-CSDN博客
5章2节:离散趋势的描述,文末1个简单函数同时搞定20个结果-CSDN博客
5章3节:在R语言中,从实际应用的角度认识假设检验-CSDN博客
5章4节:从R语言的角度认识正态分布与正态性检验-CSDN博客
5章5节:认识方差和方差齐性检验(三种方法全覆盖)-CSDN博客
5章9节:组间差异的非参数检验,Wilcoxon秩和检验和Kruskal-Wallis检验-CSDN博客
第六章:定性数据的统计描述
6章1节:定性数据的统计描述之列联表,文末有优势比计算介绍-CSDN博客
6章2节:认识birthwt数据集,EpiDisplay和Gmodels扩展包的应用-CSDN博客
6章3节:独立性检验,卡方检验,费希尔精确概率检验和Cochran-Mantel-Haenszel检验-CSDN博客
6章4节:相关关系和连续型变量的Pearson相关分析-CSDN博客
6章5节:分类型变量的Spearman相关分析,偏相关分析和相关图分析-CSDN博客
6章6节:相关图的GGally扩展包,和制表的Tableone扩展包-CSDN博客
第七章:R的传统绘图
7章1节:认识R的传统绘图系统,深度解析plot()函数和par()函数的使用-CSDN博客
7章2节:R基础绘图之散点图、直方图和概率密度图-CSDN博客
7章5节:散点矩阵图,与小提琴图、Cleveland 点图、马赛克图和等高图-CSDN博客
7章6节:用R进行图形的保存与导出,详细的高级图形输出,一文囊括大多数保存的各种问题,和如何批量保存不同情况的图形-CSDN博客
第八章:R的进阶绘图
8章1节:认识 ggplot2 扩展包,深度解析 qplot() 函数的使用-CSDN博客
8章2节:ggplot2绘图之原理逻辑分解,掌握绘图步骤(更新20241104)-CSDN博客
8章3节:ggplot2绘图之内置主题设置全解析(更新20241104)-CSDN博客
8章4节:ggplot2绘图之几何体解析(一),参考线和基准线与分布图和频数图(更新20241104)-CSDN博客
8章5节:ggplot2绘图之几何体解析(二),关系图和时间序列图与误差条和高级图形平滑曲线(更新20241104)-CSDN博客
8章6节:坐标轴须图和带状图(更新20241107)_维恩图 约翰·维恩-CSDN博客
8章7节:平行坐标图和小提琴图_r语言parallelplot绘制平行坐标图-CSDN博客
8章9节:词云图和树图(更新20241106)_echarts 可以生成词云图吗-CSDN博客
8章10节:维恩图和UpSet图_ae做柱状图动态图-CSDN博客
8章11节:R的地理图绘制(更新20241104)-CSDN博客
8章12节:三维图,由三维散点图起步,引入回归模型平面,到复杂坐标和渐变色的三维曲面图(更新20241107)-CSDN博客
8章13节:网络图(知识图谱)绘制的深度解析(更新20241109)-CSDN博客
8章15节:让 ggplot2 绘图进行顶级科研杂志的配色(更新20241118)
第九章:临床试验的统计
9章4节:两组例数相同的均数比较的样本量估计和绘制功效曲线-CSDN博客
9章5节:两组的例数不等的均数比较的样本量估计和可视化-CSDN博客
9章6节:自身配对设计的均数比较临床试验的样本量估计和可视化-CSDN博客
9章8节: 两、三组试验组率比较的样本量估算和可视化-CSDN博客
9章9节:试验的随机分组认识,用R做简单随机化-CSDN博客
9章11节:用R实现区组随机化和置换区组随机化-CSDN博客
9章12节:动态随机化方法介绍,和用R绘制随机化卡片-CSDN博客
第十章:Meta分析攻略
10章1节:认识循证医学中的Meta分析,并予代码演示分析绘图-CSDN博客
10章2节:Meta分析的7大步骤的扼要解读-CSDN博客
10章3节:二分类变量的Meta分析模型,分析公式构建和结果解读-CSDN博客
10章4节:二分类变量的Meta分析模型,绘制漏斗图和应用剪补法,最后绘制和解读轮廓增强漏斗图-CSDN博客
10章5节:二分类变量的Meta分析模型,敏感性分析和亚组分析,绘制森林图-CSDN博客
10章6节:连续型变量的Meta分析和可视化分析全解-CSDN博客
第十一章:主成分分析
11章2节:深度讲解用R进行主成分分析(中)-CSDN博客
11章3节:深度讲解用R进行主成分分析(下)-CSDN博客
第十二章:常见类型回归分析
12章4节:深度解读构建回归模型表达式的九个关键符号-CSDN博客
12章7节:构建因变量为分类变量的二分类Logistic回归模型-CSDN博客
12章8节:详解不同逻辑回归模型的比较,和如何进行变量优化-CSDN博客
12章9节:深度讲解有序多分类Logistic回归模型的分析-CSDN博客
12章10节:条件Logistic回归模型的分析-CSDN博客
第十三章:生存分析模型
13章4节:认识比例风险模型和Cox比例风险模型,学会从协变量的调整选择最优模型-CSDN博客
13章5节:用逐步回归方法来选择模型协变量,比例风险假定的检验和森林图的绘制-CSDN博客
第十四章:匹配技术应用
14章2节:匹配结果的可视化和匹配后新数据分析-CSDN博客
第十五章:判别和聚类分析
15章2节:线性判别分析预测模型构建评估和可视化演示-CSDN博客
15章4节:K-Means聚类分析的运用,和改进算法的K-Means++-CSDN博客
15章5节:实现k-medoids聚类算法的PAM和CLARA方法-CSDN博客
第十六章:机器学习入门
16章2节:机器学习在临床预测中的应用场景,与临床预测模型的关键步骤解析-CSDN博客
16章3节:详析训练数据集、测试数据集和验证数据集及其划分策略-CSDN博客
16章4节:采用随机抽样法和等比抽样法对数据集进行二份及三份的划分-CSDN博客
16章5节:划分数据的多次随机抽样的Bootstrap法和加权随机抽样法-CSDN博客
16章6节:交叉验证概述与分类,R中K折交叉验证的详细解析-CSDN博客
16章7节:机器学习算法解读,与数值预测回归模型构建-CSDN博客
16章8节:朴素贝叶斯分类预测模型,从构建、解析到实战-CSDN博客
16章9节:认识决策树,构建CART算法的决策树模型-CSDN博客
16章10节:深度解析如何构建随机森林算法预测模型-CSDN博客
16章11节:构建人工神经网络反向传播算法预测模型-CSDN博客
16章12节:认识机器学习的模型评估,掌握数值型数据的模型评估方法-CSDN博客
16章14节:评估和对比预测模型的ROC曲线和AUC值-CSDN博客
16章15节:六大ROC曲线扩展包的对比,和其它评估曲线的绘制-CSDN博客