临床试验EDC系统研发（REDCap）_redcap临床数据管理-CSDN博客

本文链接：https://blog.csdn.net/2301_79425796/article/details/143983782

一、REDCap是什么？

REDCap（Research Electronic Data Capture）是一款专为非营利组织设计的电子数据采集软件，由Vanderbilt大学开发。尽管REDCap软件可以免费使用，但它并非开源软件。为了使用REDCap，您的机构需要加入REDCap联盟，并签署最终用户许可协议（EULA）。

1、加入REDCap联盟的要求

加入REDCap联盟需要在线提交一份标准的最终用户许可协议。该协议必须在Vanderbilt大学与您的机构之间正式签署。为了确保许可提交顺利，请事先与以下部门协调：技术转让部门、法务部门、IT部门等。

签署许可协议后，您的机构将获得REDCap源代码的访问权限。需要注意的是，尽管REDCap免费提供，但它并不是开源软件。更多详情请参考FAQ部分的“REDCap是开源软件吗？”提交许可协议之前，请仔细阅读相关信息，并完成资格调查问卷。如果符合条件，系统将生成正式的许可链接供您提交。

REDCap的运行需要满足特定的IT基础设施要求，例如：PHP Web服务器、MySQL数据库服务器等。根据许可条款，所有技术支持必须由机构内部的IT部门提供。禁止外包支持服务（包括非正式的志愿者支持）。技术支持人员必须是机构的正式员工，而非第三方服务提供商。

建议机构内部指定一名或多名管理员，为REDCap用户提供日常非技术性支持。这可以显著提高系统的使用效率和用户体验。

2、加入REDCap联盟之后

加入REDCap联盟后，您将获得访问专属在线门户 Community 的权限。该门户为联盟成员提供：内部知识库、技术文档和支持资源。

REDCap联盟定期举办网络研讨会，涵盖以下主题：软件故障排查、新功能开发与优先级讨论和技术支持与教育机会。

通过Community平台、研讨会和年度线下活动 REDCapCon，联盟成员可以共同开发新模块、改进文档、优化项目管理模式，并为新成员提供支持。这种全球协作是REDCap成功的关键所在。

许可证提交步骤，在提交之前，请认真阅读REDCap最终用户许可协议的条款和条件。根据问卷结果，系统会生成正式的许可链接（若不符合条件，系统将提供其他使用建议）。按照指引完成许可协议的提交流程。如有疑问，请联系Vanderbilt REDCap团队：redcap@vumc.org。

3、REDCap 提供的功能

REDCap 提供多样化的功能和强大的灵活性，适用于各种规模的研究项目。用户可以通过 在线设计器 或 离线数据字典模板 快速创建问卷或数据库，从项目构想到生产级应用通常仅需一天。REDCap 为用户提供完全自主的项目管理能力，包括用户权限分配、问卷自定义和项目日志记录等功能。它还支持多机构合作，研究人员可以跨站点共享数据库，适用于多中心研究项目。

REDCap 的功能高度丰富，能够满足研究数据管理的各种需求。它内置了数据验证逻辑、逻辑分支、计算字段等高级功能，帮助用户实现动态的数据采集与管理。同时，系统支持自动化数据导出，可以轻松生成 Excel、PDF 报告，或直接与 SPSS、SAS、Stata、R 等统计工具对接。除了内置的项目日历、排期模块和报告工具外，REDCap 还支持文件上传功能，全面提升数据管理的便捷性。此外，通过强大的审计日志，用户可以清晰追踪所有数据操作和用户活动，确保研究过程透明合规。

安全性和合规性是 REDCap 的核心优势之一。系统支持安装在满足多种国际标准（如 HIPAA、21 CFR Part 11、FISMA）的环境中，并通过 FHIR 接口与电子健康记录（EHR）系统实现互操作性，确保医疗数据的安全传输与整合。REDCap 提供了跨平台支持，包括 iOS 和 Android 移动应用，用户可随时随地进行数据采集与管理。作为一款开源工具，REDCap 已支持多种语言，包括中文、法语和德语等，同时欢迎合作伙伴贡献更多语言版本。如果你对这款高效、安全的工具感兴趣，可以通过官网加入 REDCap 合作联盟，开启便捷的数据管理之旅！

4、再谈谈REDCap 联盟

在 REDCap 软件开发团队的工作基础上，一个强大的专家网络正在持续发挥重要作用，这便是 REDCap 联盟（REDCap Consortium）。作为一名新加入的 REDCap 授权合作伙伴和软件管理员，您将获得一套完善的支持系统，不仅有助于管理本地的 REDCap 部署，还能支持您的机构用户和协作伙伴。

REDCap 联盟的成员由来自世界各地的志愿者组成，他们每天为管理者们的各种问题提供免费支持。这些问题既包括常见的管理问题，也涉及更复杂的技术挑战。联盟成员的协作模式非常高效，他们定期交流经验、分享知识，无偿贡献自己的专业技能，形成了一个互助共赢的社区。

这些志愿者还通过以下方式为联盟提供支持：

年度会议中的领导作用：担任会议主持人或小组委员会成员，积极推进项目进展。
参与专门项目小组：定期参与网络研讨会，讨论研究应用案例、开发工具或新功能。
贡献工具和材料：共享开发的 REDCap 数据采集工具、培训材料以及自定义的外部模块。
测试与反馈：为软件的测试、新功能和新应用提供重要反馈意见。

联盟成员的背景多种多样，既包括为本机构提供管理支持的非技术型人员，也包括在研究信息学领域处于领先地位的技术专家。正因如此，REDCap 联盟被誉为一个独特的、充满热情且关怀的集体，他们致力于推动 REDCap 的使命。联盟欢迎所有成员，无论角色大小，都可以在社区中既作为“消费者”也作为“贡献者”积极参与。

Vanderbilt 团队提供的支持资源

作为 REDCap 的发源地，Vanderbilt 团队为联盟成员提供了一系列支持工具，以帮助管理员和用户更好地使用 REDCap 系统，包括：一个知识管理平台，包含软件下载、重要文档、支持问答等内容，仅限已注册的管理员访问。会议内容涵盖最新的 REDCap 动态、操作演示、使用案例分享等，由 Vanderbilt 团队及联盟成员主讲。每周一次的专门会议，针对管理员的具体问题，由 REDCap 首席开发人员提供深入的技术指导。为各委员会和小组的任务和目标提供组织支持。提供团队建设、网络交流和学习机会。通过 redcap@vumc.org 获取专属资源的支持。针对 REDCap 移动应用的技术支持，可通过 redcapapp@vumc.org 联系。

二、REDCap能做什么？

1、REDCap基础环境

围绕REDCap的安全性很大程度上与REDCap软件本身无关，而是依赖于REDCap安装所在的IT基础设施和环境。这包括Web服务器和数据库服务器、这两个服务器之间的通信，以及Web服务器与REDCap最终用户的通信。典型的最佳实践是Web服务器和数据库服务器应该是两个独立的服务器，并且数据库服务器应该安全地位于防火墙后面。Web服务器可以位于防火墙后面或DMZ（非军事区）。许多机构（包括范德堡大学）将Web服务器托管在DMZ中，以便它在防火墙外对整个互联网可用。为了与最终用户保持安全通信，需要在Web服务器上使用SSL，因此Web服务器必须设置有SSL证书。关于REDCap的数据备份，大多数托管REDCap的机构通常会每天（或每天两次）备份他们的REDCap数据库表，通常使用mysqldump或其他类似软件。REDCap对服务器处理能力、内存或硬盘空间没有硬性要求，因为它在大多数方面都非常轻量级，并且对Web服务器或数据库服务器的初始驱动空间要求非常少。通常建议最初为Web服务器和数据库服务器各分配10GB。对于大多数机构来说，即使在重负载下运行REDCap，这个存储空间通常也足够使用第一年（或更长时间）。由于所有机构和用户都不同，REDCap随时间消耗的硬盘空间并不总是可预测的，但在经过几个月的日常REDCap用户稳定使用后，随时间消耗的空间量变得相当可预测。如果Web服务器可以被Web访问（即在DMZ中），则建议REDCap中的文件不要存储在Web服务器上，而是存储在防火墙后面的另一个服务器上（类似于数据库服务器）。无论您是在典型的文件服务器、网络附加存储（NAS）还是网络文件系统（NFS）上存储REDCap文件，最安全的地方是使用WebDAV协议（SSL支持）通过安全通信存储在防火墙后面，REDCap控制中心有一个选项可以启用WebDAV选项。如果Web服务器位于防火墙后面且不可供Web访问（即不在DMZ中），那么将REDCap文件存储在本地Web服务器或挂载到Web服务器的文件系统上可能完全没有问题。无论您的设置如何，您应该首先咨询您机构的政策，看看是否有任何关于文件存储的机构规定或要求（特别是涉及包含识别信息的文件——例如PHI），然后再最终确定您的生产REDCap环境。

安装REDCap的基础设施要求和依赖性列表相当短。REDCap可以在许多不同的操作系统上运行（Linux、Unix、Windows、Mac）。REDCap唯一的要求是必须安装以下硬件和软件。（注：所有必需的软件都是开源的。）

带有PHP 7.2.5及以上版本的Web服务器（例如Microsoft IIS或Apache）。
带有MySQL 5.5.5+或MariaDB 5.5.5+的数据库服务器。 a. MySQL客户端——安装/升级必需（例如phpMyAdmin、MySQL Workbench）。
SMTP电子邮件服务器——为了从REDCap发送电子邮件，必须在Web服务器上配置SMTP服务器与PHP一起使用。它可以安装在同一个Web服务器上，或者安装在单独的服务器上（更推荐），例如现有的机构SMTP服务器（如果可用）。
文件服务器（可选）——根据您的基础设施和设置，您可能希望使用一个单独的服务器仅用于上传/存储在REDCap中的文件。如果您的Web服务器可以被Web访问（即在DMZ中），强烈建议有一个单独的文件服务器位于防火墙后面，使用WebDAV协议（SSL支持）安全地与REDCap通信。首先咨询您当地的政策，以防您的机构对此有规定或要求。

2、REDCap认证

REDCap实施认证以验证登录系统的最终用户的身份。REDCap有几种认证方法可供使用：LDAP、Shibboleth、OpenID、Google OAuth2，以及内部基于表格的认证方法，还可以结合LDAP和基于表格的方法。运行REDCap的机构可以选择对他们来说最有效的认证方法。基于表格的认证，它使用数据库表中存储的用户名/密码对，通常是最容易设置的，因为它是内置的，不需要设置和配置外部服务即可操作。出于安全原因，数据库表中的密码不是以明文存储的，而是首先使用SHA-512加密哈希函数进行加盐哈希，然后存储在数据库表中。同样值得注意的是，每个用户账户都有自己的唯一盐值。REDCap包含一个可定制的自动注销设置（默认自动注销时间为30分钟），如果用户在当前网页上没有任何活动（例如点击、打字、移动鼠标），系统将在设定的时间后自动将用户从系统中注销。这可以防止其他人在他们离开工作站时没有正确注销或关闭浏览器窗口而访问他们的账户和项目数据。还有一些可定制的设置管理登录活动，例如可以手动设置在用户被锁定系统指定时间之前失败的登录尝试次数。还有一个用户挂起状态，可以为任何给定的用户设置。挂起用户允许他们保持系统中的用户，但拒绝他们访问整个REDCap应用程序，直到他们的挂起状态被撤销。出于各种原因，挂起用户比从系统中永久删除用户更可取。还有一些特定于基于表格认证的安全设置。这些包括允许用户设置自己的密码，并在需要时阻止他们重用最近的密码。用户也可以在指定的天数后自动被迫更改密码。如果使用LDAP或Shibboleth认证，系统可以设置为允许任何和所有用户能够自动创建自己的REDCap账户，或者相反，这些用户只能在管理员首先将他们添加到用户白名单后才能访问REDCap。通过这种方式，本地REDCap管理员可以选择他们希望对新用户如何获得REDCap访问权限更加或更少的限制。通过在REDCap中启用双因素认证，可以提高与认证相关的安全性。双因素认证（有时称为两步登录）是REDCap的一个可选设置，可以在控制中心启用。一旦启用，双因素认证要求用户在登录过程中执行一个额外的步骤。有几种可用的选项，例如用户必须输入通过电子邮件获得的6位代码，通过SMS短信获得，或通过移动设备上的Google Authenticator应用程序获得。另一个选项是使用Duo应用程序，如果机构已经使用Duo双因素认证。

3、REDCap日志记录和审计追踪

REDCap内置了审计追踪功能，自动记录所有用户活动和每个用户查看的所有页面，包括上下文信息（例如被访问的项目或记录）。无论是输入数据、导出数据、修改字段、运行报告，还是添加/修改用户等众多其他活动，REDCap都会记录所有操作。日志记录本身可以在项目内由被授权查看日志页面的用户查看。日志页面允许这些用户查看或导出该项目的整个审计追踪，并根据活动类型和/或用户以各种方式过滤审计追踪。REDCap内置的审计追踪功能使管理员能够确定任何给定用户查看或修改的所有活动和所有数据。

4、REDCap数据导出和去识别化

REDCap允许用户从他们的REDCap项目中导出任何和所有数据，前提是他们被授予了完整的数据导出权限。数据可以以各种方式和各种格式导出。数据可以作为CSV（逗号分隔）文件从报告中导出，也可以在查看特定记录时以PDF文件的形式从数据输入页面导出。数据导出工具页面允许用户将项目收集的数据导出为CSV文件，该文件可以在Excel或几种流行的统计分析软件包中打开，如SAS、SPSS、Stata和R。也可以使用REDCap API从项目中导出数据，该API可以以几种格式（CSV、JSON或XML）导出数据。数据导出工具具有高级导出功能，允许实施数据去识别化方法，例如能够自动删除自由文本字段、删除日期、执行日期偏移，并从用户导出的数据文件中删除标记为标识符的字段（例如PHI）。用户权限也可以设置，以便一些用户可以从项目中导出数据，但将数据去识别化方法作为防止他们导出敏感数据的手段，无论是意外还是故意的。

5、REDCap数据存储

REDCap将其数据和所有系统和项目信息存储在单个MySQL数据库的各种关系数据库表中（即使用外键和索引），这是一个开源的关系数据库管理系统（RDBMS）。REDCap的前端是用PHP编写的，PHP是一种广泛使用、健壮的开源Web应用程序脚本语言。设置Web服务器和数据库服务器以及保护服务器之间的通信和最终用户的通信是安装REDCap的合作机构的责任，因此必须在安装REDCap之前完成。安装REDCap的机构将在其自己的服务器上存储REDCap捕获的所有数据。因此，所有项目数据都存储并托管在该当地机构，REDCap从未在任何时候将项目数据从该机构传输到另一个机构或组织。REDCap的本地网页编码和数据库存储校对是UTF-8，允许在REDCap中存储的用户定义文本中使用非英语语言。这包括为项目输入的数据或为调查问题或数据库字段标签定义的文本等许多其他类型的用户定义文本。REDCap的数据库表实现了MySQL的Innodb存储引擎，允许使用外键进行引用完整性、事务和行级锁定（而不是表级锁定），所有这些都是REDCap为了一致性、性能和可扩展性所需的。REDCap不使用数据库服务器上的数据加密（即“静态”加密）。（这不要与通过SSL传输到数据库的数据加密混淆，这应该始终完成，并且必须由合作机构设置。）如果数据库服务器得到适当保护，就不需要对数据库数据进行加密。然而，一些机构或合规办公室要求加密。在这些情况下，合作机构被鼓励寻求文件系统级加密解决方案或数据库级加密解决方案。目前，数据库级静态数据加密有两个选项：

MariaDB 10.1.3+支持加密（使用Google补丁）。

MySQL 5.7.11+（和Percona Server 5.7.11）有InnoDB表空间级加密。

所有在REDCap中上传和/或存储的文档将存储在本地REDCap Web服务器上，在挂载到Web服务器的本地文件服务器上，或使用WebDAV协议（SSL支持）的单独服务器上。在REDCap的旧版本中，一些类型的文件存储在数据库表中，但不再这样做。存储在REDCap中的文件不是以加密格式存储，而是以其原始形式（尽管在不同的文件名下）存储。如果合作机构选择在本地Web服务器上存储REDCap文件，强烈建议将文件存储在不可供Web访问的 secure directory中（即不在Web根目录下）。

6、REDCap安全

为了帮助保护和确保存储在REDCap后端数据库中的数据安全，软件应用程序采用了各种方法来保护免受可能尝试识别和利用系统中任何安全漏洞的恶意用户的攻击。这些方法将在技术细节上描述。在REDCap中，所有传入数据都经过有意的过滤、消毒和转义。这包括所有通过HTTP Post请求提交的数据和用户访问REDCap时在每个URL中找到的所有查询字符串数据，以及其他用户定义的数据提交方式。易受最终用户伪造的服务器环境变量也经过检查和消毒。所有用户提交的数据都经过适当的过滤，以去除任何可能有害的标记标签（例如<script>），然后在显示在应用程序内的Web页面之前进行转义。从REDCap发送到数据库服务器的SQL查询在发送之前都经过适当的转义。如果SQL查询中使用的任何值源自用户定义的值，它们也将事先经过消毒，如上所述。用于SQL查询的用户定义数据会检查数据类型以防止数据类型不匹配（例如确保数字确实是数字）。这些消毒、过滤、数据类型检查和转义的过程都有助于防止攻击方法，如跨站脚本攻击（XSS）和SQL注入。为了特别防止跨站请求伪造（CSRF），REDCap在应用程序中使用的每个Web表单上使用“nonce”（一个秘密的、用户特定的令牌）。nonce是为每个新的HTTP请求在每个REDCap会话中生成的唯一值。此外，REDCap在其Web页面上采用“速率限制”，允许每个IP地址每分钟有设定的最大Web请求数量，超过该最大值后，该用户的IP地址将被永久禁止使用REDCap。每个IP地址每分钟的请求速率限制值是可定制的，并且可以在REDCap的控制中心内修改，如果需要的话。速率限制可以防止由机器人发起的拒绝服务攻击，以及防止其他需要在短时间内向服务器发出许多请求的黑客攻击，例如BREACH攻击。关于特别防止BREACH攻击，除了使用速率限制外，REDCap还在每个Web页面上输出一个不可见的随机文本字符串，长度随机，作为一种有效的技术来减轻此类攻击。REDCap在每个Web表单上使用独特的nonce令牌也大大降低了BREACH攻击的可能性。许多安装REDCap的机构已经使用企业级Web应用程序安全扫描器扫描和测试REDCap的安全性及其承受各种攻击方法的能力。REDCap在这种情况下表现非常好。任何希望使用安全扫描软件扫描REDCap的合作机构都可以自由地这样做，而无需范德堡大学或REDCap开发者的同意，只要被扫描的REDCap实例是他们自己的，并且不是由另一个机构/组织托管的。如果一个机构决定对REDCap进行安全扫描，并发现任何直接与REDCap相关的中高风险安全问题，他们被鼓励联系范德堡的REDCap开发者，以便这些问题可以立即得到解决。关于REDCap使用的cookie的安全性，由REDCap创建的所有会话cookie和其他与认证相关的cookie将自动将“HttpOnly”属性设置为TRUE。默认情况下，“Secure”cookie标志将设置为FALSE。虽然这稍微不太安全，但将其值设置为TRUE有时会导致某些服务器配置的登录问题，例如反向代理。因此，出于兼容性原因，默认设置为FALSE。然而，任何机构都可以通过在REDCap Web服务器的PHP.INI配置文件中设置session.cookie_secure=On来启用会话cookie的“Secure”标志以提高安全性。

7、数据互操作性

REDCap具有用于轻松导出和导入数据的模块，这些模块对于通过Web界面手动将数据导入和导出REDCap非常有用。但由于各种原因，有时需要能够以自动化或程序化的方式在系统之间迁移数据。REDCap有能力使用几种不同的方法将数据移入和移出各个REDCap项目，这些方法不需要Web界面。REDCap API是一个接口，允许外部应用程序远程连接到REDCap，并用于以程序化方式检索或修改REDCap内的数据或设置。这包括从指定的REDCap项目中执行自动化数据导入/导出，导入/导出项目元数据（即数据字典），事件。甚至还有一个API方法用于创建全新的项目。API是REDCap的内置功能，因此不需要安装。REDCap API使用令牌作为验证和验证所有收到的API请求的手段。类似于REDCap Web界面中的数据导入工具，API在用于数据导入目的时也实现数据验证，以确保只有有效的数据被存储。API提供了一种非常高效的方式，可以轻松地将数据移动到另一个系统或从另一个系统移动数据。REDCap可以利用的另一个数据互操作性服务是动态数据拉取（DDP）模块。DDP是一个特殊功能，用于从外部源系统导入数据到REDCap。它提供了一个裁决过程，REDCap用户可以在其中批准来自源系统的所有传入数据，然后才正式保存在他们的REDCap项目中。虽然主要的DDP模块预安装在REDCap中，但托管机构需要创建至少两个Web服务作为中间件，以便REDCap可以使用这些服务与数据源系统进行通信，反之亦然。DDP仅支持从源系统导入数据到REDCap（而API支持数据导入和导出）。由于DDP假设来自源系统的所有传入数据可能不可信或只有数据的一个子集需要从源系统导入，DDP在REDCap的Web界面中使用一个裁决Web页面，最终用户可以在其中审查从源系统获得的数据，然后确认将其导入他们的REDCap项目。DDP可以立即实时从源系统获取数据，只要输入记录标识符（例如，病历号）。它还有一个辅助的cron作业，每天运行一次，获取可能已输入源系统的任何新数据。

市面上的 R 语言培训班和书籍（包括网络上的文章或视频），由于受限于培训时间或书籍篇幅，往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景，内容泛泛而谈，最终无法真正解决实际工作中的问题。同时，它们也缺乏针对医药领域的深度结合与讨论。为了解决这些痛点，我们推出了《用 R 探索医药数据科学》专栏。该专栏将持续更新，不仅为您提供系统化的学习内容，更致力于成为您掌握最新、最全医药数据科学技术的得力助手。

每篇文章篇幅在5000字至9000字之间。
内容涵盖试验统计、预测模型、科研绘图、数据库、机器学习等热点领域。

《用 R 探索医药数据科学》专栏目录（截止11月份19日）

临床试验EDC系统研发（REDCap）

一、REDCap是什么？

1、加入REDCap联盟的要求

2、加入REDCap联盟之后

3、REDCap 提供的功能

4、再谈谈REDCap 联盟

Vanderbilt 团队提供的支持资源

1、REDCap基础环境

2、REDCap认证

3、REDCap日志记录和审计追踪

4、REDCap数据导出和去识别化

5、REDCap数据存储

6、REDCap安全​​​​​​​

7、数据互操作性

《用 R 探索医药数据科学》专栏目录（截止11月份19日）

第一章：认识数据科学和R

第二章：R的安装和数据读取

第三章：认识数据

第四章：数据的预处理

第五章：定量数据的统计描述

第六章：定性数据的统计描述

第七章：R的传统绘图

第八章：R的进阶绘图

第九章：临床试验的统计

第十章：Meta分析攻略

第十一章：主成分分析

第十二章：常见类型回归分析

第十三章：生存分析模型

第十四章：匹配技术应用

第十五章：判别和聚类分析

第十六章：机器学习入门

第十七章：文献计量学

6、REDCap安全