临床试验研究数据列表模型元数据递交指南(CDISC SDTM-MSG v2.0)

信息来源:

SDTM Metadata Submission Guidelines v2.0 | CDISC

SDTM-MSG_v2.0.pdf

以下中文都是机器翻译,所有图片都来自于上述CDISC官网,仅供自学;转载请注明出处。

1 引言
1.1 目的
研究数据制表模型元数据提交指南:人体临床试验 (SDTM-MSG) 的目的是为准备国际协调会议 (ICH) 电子通用技术文件 (eCTD) 模块 5 (M5) 临床研究报告“sdtm”文件夹的组件提供指导。本文档和相关的示例提交包说明了建议用于以电子方式提交 SDTM 数据的组件。这些准则基于 Define-XML v2.1、SDTM v1.7/SDTMIG v3.3 和 SDTM 术语 2020-03-27。

示例提交包

SDTM-MSG 包中包含的示例文件旨在从 CDISC 的角度说明监管提交最佳实践。因此,示例包被视为虚构的,并不表示实际的监管提交。支持示例提交包包括以下内容:

• SDTM 注释的 CRF (acrf.pdf)

• SAS 版本 5 传输文件格式的 SDTM 数据集(*.xpt,其中星号 (*) 表示以小写形式表示的 SDTM 数据集名称,例如 dm)

        o 注意:SDTM v1.7/SDTMIG v3.3 数据集由 CDISC SDS MSG 团队手动和以编程方式进行评估。在准备 SDTM-MSG v2.0 进行内部审查时,CDISC SDTM v1.7/SDTMIG v3.3 一致性规则最近发布,但任何验证工具都无法进行验证。

• 数据集 XML 文件格式 (*.xml) 的 SDTM 数据集。请参阅附录 C,MSG 包免责声明,了解包含 Dataset-XML。

• 描述提交的 SDTM 数据集元数据的 Define-XML 文档 (define.xml)

        o 注意:Define-XML 文档由 CDISC SDS MSG 团队以编程方式手动评估。在准备 SDTM-MSG v2.0 进行内部审查时,CDISC Define-XML v2.1 一致性规则尚未发布,也未被任何验证工具用于验证。请确保 Define-XML v2.1 文档的任何正式监管提交均按照相应监管机构的要求/指南完成。

• 临床研究数据审阅者指南 (csdrg.pdf)

注意:SDTM-MSG 中未讨论其他可能的监管提交文件(例如,研究数据标准化计划;见 https://www.phuse.eu/css-deliverables)。

最佳实践

在研究开发生命周期的早期开发 Define-XML 和带注释的 CRF 组件有助于提高整体效率,使研究团队能够在研究开发过程中管理潜在的增量变化,并确保各个组件之间的一致性。当这些组件用于监管提交时,这一点尤其重要,从而有助于传播更快速的提交包编译过程。

一般说明:

在此版本的 SDTM-MSG 发布后,监管机构的要求可能会发生变化。因此,在编制监管提交文件时,始终建议参考每个相应监管机构的最新要求和/或指南(例如,美国 FDA 通过研究数据标准资源、https://www.fda.gov/industry/;日本 PMDA 通过电子新药审查,https://www.pmda.go.jp/english/review-services/)。

需要注意的是,该 MSG 包包括 SDTMIG v3.3 和 Define-XML 2.1。在开发 MSG 的未来版本之前,其中提供的原则可以应用于这些标准的其他版本。

1.2 本文件的组织 
本文件分为以下几个部分:

• 第 1 节,引言,描述了本文档的目的和组织。
• 第 2 节,定义 XML 文档,解释了提交数据集的元数据定义部分。
• 第 3 节,带注释的 CRF,提供了根据 SDTM 规范注释 CRF 的指南。
• 第 4 节,临床研究数据审阅指南,解释了支持样本提交的 cSDRG 准备。
• 第 5 节, 提交数据集,概述了样本提交中包含的 SDTM 数据集。

• 附录提供了额外的背景材料。

2 Define-XML 文档
Define-XML 文档(Define-XML 包中使用的实际文件名:“define.xml”)是用于描述研究数据的格式和内容的元数据,包括数据集、变量、值级元数据和代码列表。MSG 的 1.0 版对 Define-XML 文档进行了非常详细的解释;由于 Define-XML 规范现在包含所有必要的详细信息,因此此版本的 MSG 仅包含该信息的一小部分。

一般说明

Define-XML 文档是仅包含纯文本的机器可读文档。它不包含用于查看或打印的格式。相反,格式设置由样式表处理,该样式表控制 Define-XML 文档的显示方式和显示的值。

Define-XML 显示
示例提交 (define2-1.xsl) 中的样式表是 Define-XML v2.1 包中包含的样式表。对于提交中应包含的样式表,没有具体要求。请参阅附录 B 中的“浏览器显示/功能问题”部分 提交包软件问题.

Codelists
Define-XML 文档中的代码列表应仅包含给定用例的可能值。

在示例提交中:

• 在一个代码列表中为 ECDOSU 定义单位,在另一个代码列表中为 ECPSTRGU 定义单位,即使它们都处于 Exposure as Collected (EC) 中并且都包含单位。因为 ECDOSU 只能包含 “mL”,而 ECPSTRGU 只能包含 “g/L”,所以将它们添加到同一个代码列表并将其应用于两个变量是没有意义的,而使用整个 CDISC CT“Unit”代码列表向这两个变量添加代码列表也没什么意义。

• 为每个域/数据集向 DOMAIN 添加了一个单独的代码列表,尽管该粒度级别可能比许多赞助商更愿意这样做。

• 对于人口统计 (DM),RACE 具有多个来源,CRF 上的 5 个单独种族为“Collected”,MULTIPLE 的值为“Assigned”,该值是在选择多个单独种族时分配的。Origin 在值级元数据中处理,其中添加了不同的代码列表,每个代码列表都只有该实例中可能的值。

数据集顺序 
所有制表数据集都必须包含在数据集级别的元数据中。数据集应按类分组,然后按域的字母顺序列出,然后在 Define-XML 文档中的每个类中按 name 属性列出。

类的推荐顺序为:

• TRIAL DESIGN
• SPECIAL PURPOSE
• INTERVENTIONS
• EVENTS
• FINDINGS
• FINDINGS ABOUT
• RELATIONSHIP
• STUDY REFERENCE

3 带注释的 CRF 
带注释的 CRF(样本提交包中使用的实际文件名:“acrf.pdf”)应为 PDF 格式。“acrf.pdf”是 FDA 和 PMDA 建议的当前文件名。它通过注释相应的 SDTM 数据集、变量和 CRF 上标识的任何关联注释来描述上下文中收集的数据。本节将介绍生成带注释的 CRF 的最佳实践和指南。

3.1 注释的基本原则
申办者可以选择任何可用的工具/应用程序来创建注释。无论使用何种工具/应用程序,CRF 注释都应该是可搜索的(即基于文本的),以增强数据包审查过程。由于 acrf.pdf 支持审阅过程,因此注释应反映要在 SDTM 中提交的数据。

如果要收集预期数据,但实际上没有收集,则带注释的 CRF 将代表如果收集了这些数据,本应提交的数据。无需重新注释acrf.pdf以指示未收集任何数据。未收集数据的事实将在 Define-XML 文档中使用数据集和变量的 “HasNoData” 属性进行指示。样本提交包中包含这方面的示例;请参阅 DM 补充限定符变量 RACE4 和 RACE5,以及 NV、SUPPNV 和 SUPPOE 数据集。这也可以在临床研究数据审阅者指南中进一步描述。

带注释的 CRF 的目的是描述每个数据项在 SDTM 数据集中的表示位置。推荐的双重书签(参见第 3.2 节,为 CRF/eCRF 添加书签)和目录将进一步为审阅者提供研究数据收集设计/结构的概述。

一般说明:

操作/管理变量名称注释应仅包含制表数据集的注释。表示申办者内部变量(例如,系统或集合变量名称)的注释虽然申办者通常需要用于数据管理,但如果这些变量名称不是监管提交的一部分,则不应包含在acrf.pdf中。

3.1.1 注释独特的 CRF 页面
目前,申办者可以在acrf.pdf中包含整个 CRF 案例集或仅包含独特的表格(在“信息”框中描述)。传统上用于注释纸质 CRF 的 PDF 格式副本的约定在注释 eCRF 时可能无法转换为最佳实践。例如,当 Vital Signs 表单在 10 次就诊时使用时,纸质案例簿中存在该表单的 10 个物理副本。在电子 CRF 中,有 1 个电子 VS 表格,它呈现 10 次不同的时间,每个数据收集实例一次。

• 建议申办者仅包含和注释独特的表格。Bookmarking 将根据需要多次表示表单,以反映数据的收集方式。例如,将根据临床访问 1、3 和 5 为 VS 表单添加书签。在这种情况下,所有 3 次访问都将被添加为书签并链接到相应的唯一 VS 表单。

• 选择提交整个 CRF 而不是唯一表格的申办者负责确定最能让审阅者了解给定页面多次出现的提交方法。

一般说明:

唯一页面 确定哪些页面被视为唯一页面是赞助商的决定。以下是可用于该确定的一些一般准则:

• 如果 CRF 页面的数据收集点被添加、删除或以其他方式与 CRF 页面的其他实例不同 (例如,允许的值被更改),则该页面被视为唯一页面。

• 对 CRF 页面进行细微的重新排列,而不会影响数据收集,这通常不会影响唯一性。

• CRF 页面上的指导(或操作)信息不会影响数据收集,通常不会影响唯一性。

应避免部分 CRF 页面注释。例如,如果一个 CRF 页面比另一个类似页面有 1 个或多个收集的数据点,则建议对两个/所有 CRF 页面都进行注释。在这种情况下,仅注释新的收集点并引用另一个页面上的注释(例如,“请参阅<n>注释页面”)会使可审阅性更加困难。以下是 3 个略有不同的 VS 表单,每个表单都进行了完全注释。

样式1

样式2

样式3

一般说明:

注释非传统数字馆藏源注释 CRF 页面不仅限于传统纸张和 eCRF。随着新的数字设备和采集方法的增加,例如电子患者报告结果 (ePRO),申办方可以以类似的方式包含其各自采集屏幕的表示。此类设备是研究的一部分,可能包括相应的数据收集屏幕。在 Define-XML 文档中,此数据的源类型通常为“Collected”,源为“Subject”。如果包括非传统数字设备(例如 ePRO),则应将相应的采集屏幕附加到传统 eCRF 的末尾。这确保了单个acrf.pdf中使用的数据收集源的一致性。进一步澄清 cSDRG 中可能包含哪些非传统数字馆藏来源也可能有益。

通常的做法是,如果在 CRF 上注释了一个变量,则它的来源必须为 “Collected”。但是,在某些情况下,对于不被视为“已收集”的变量,其他注释可能有助于向审阅者阐明数据收集。例如,在前面的 VS 批注的 CRF 页面中,即使其来源不是“已收集”,也会对“VSREPNUM”变量进行批注以提供进一步的清晰度。为确保审阅者能够区分“已收集”与旨在提供进一步清晰度的注释,SDTM-MSG 建议对不代表已收集数据的注释使用虚线注释边框。这将有助于减少不必要的跨文档引用(例如,在 define.xml 和 acrf.pdf 之间)。

3.1.2 注解的外观

一般说明 关于 CDASH 和 MSG 之间的注释差异,请参阅附录 C,MSG 包免责声明。

以下是最大化注释外观和可读性的建议。利用一致的方法来开发带注释的 CRF 可以确保审阅者更加清晰和运营效率。

1. CRF 页面或集合屏幕上表示的每个域都应该有自己的注释。

        a. MSG 团队在示例 aCRF 中提供了 CRF 注释示例。由于 CRF 设计中的潜在差异,域和变量注释的放置可能并不总是合适的。因此,申办者应确保基于其 CRF 设计的注释放置的一致性。

        b. 对域名而不是数据集(包括拆分数据集)名称进行注释。例如,样本提交“QS(问卷)”为两个拆分的 QS 数据集(QSPH 和 QSSL)进行了注释。

        c. 补充限定符域名不需要注释。相应的补充限定符域变量的注释等同于父域。

2. 域注释应使用黑色文本和粗体格式。

        a. 示例提交中带批注的 CRF 使用 Arial 字体。申办者应始终查阅相应的监管机构指南和/或要求。

3. 变量注释应使用黑色文本,不要使用粗体格式。

        a. 示例提交中带批注的 CRF 使用 Arial 字体。申办者应始终查阅相应的监管机构指南和/或要求。

4. 注释应使用 12 磅字体大小,但以下情况除外:

        a. 申办者选择增加或减小注释字体大小以适应其 CRF 页面或集合屏幕;或

        b. 遵守监管机构的指导/要求。

5. 变量和数据集代码的注释应大写(例如,SUPPAE 中的 “BRTHDTC”、“AEACN01 ”)。对于数据集标签,约定应为“<数据集代码> (<数据集标签>)”,例如“DM (Demographics)”。有关建议,请参见部分 3.1.3, 批注特定类型的数据。

6. 说明文本和注释应采用句子大小写,不包括变量和数据集代码,它们应如上所述大写。

7. CDISC MSG 团队建议在单个 CRF 页面或集合屏幕上注释多个域时使用以下颜色序列。此颜色序列已使用多种应用程序(例如 Coblis Color Blindness Simulator;https://www.color-blindness.com/)进行了测试,以最大限度地减少色盲患者的困难。此处提供的红-绿-蓝 (RGB) 颜色代码允许申办者应用相同的颜色。在其 CRF 页面上需要 4 种以上颜色的申办者应使用一致的颜色并考虑色盲。

8. 注释是解释 CRF 上情况的注释,而不是直接变量注释,应具有它们所属域的颜色。与多个域相关的注释应具有适当的背景,以表明它们不是特定于域的。赞助者可以为此类注释添加虚线边框,以将其与集合变量注释区分开来。

9. 避免遮盖 CRF 页面或采集屏幕上的文字;根据需要,请参阅步骤 4。

10. 补充参考文献(通过方框、箭头和线条)可用于进一步阐明注释。

        a. 当不需要时,应限制或避免使用此方法。

        b.样本提交包中的 SWLS QS(问卷)页面适当地说明了此应用程序。

11. 当在同一注释中注释多个变量时,建议使用正斜杠 “/ ” 分隔变量。

12. 对于不会出现在 SDTM 数据中的所收集数据的注释(例如,提示问题)应注释为“[未提交]”。

13. 如果注释在提交前被“扁平化”,则应保持可搜索状态,以便更好地进行跟踪。拼合 PDF 文件可以将文件的所有内容合并到一个单元中。

14. 当引用与变量注释相关的显式值时,MSG 团队不建议使用引号(例如,表示为 DSCAT = PROTOCOL MILESTONE 而不是 DSCAT = “PROTOCOL MILESTONE”)。一般来说,MSG 团队不建议使用引号,尽管在某些情况下,使用引号可能会提供清晰度。

15. 在构建 when/then 注释语句时,MSG 团队建议使用“<variable> when <variable>=<value>”的格式(例如,当 VSTESTCD = TEMP 时表示为 VSORRES/VSORRESU)。

        a. MSG 团队尚未确定需要注释格式为 ““<variable> = <value> when <variable> = …”, 并且<value>包含单词 “when”。因此,没有提供任何指南。

在 SDTM-MSG v1.0 中,变量注释示例以红色、粗体和斜体文本为特色,尽管文档中不包含任何首选项。对于 SDTM-MSG v2.0,对此进行了重新检查并确定当使用没有粗体或斜体的黑色文本时,注释更易于阅读(并且覆盖的 CRF 页面更少)。SDTM-MSG v1.0 还包括使用“=”格式的域注释(例如,DM = Demographics)。这使得域注释和变量注释看起来非常相似,没有明显的视觉区别。SDTM-MSG v2.0 中也对此进行了更新,以更好地帮助区分域注释和变量注释(例如,“DM (Demographics)”)。通过确保域注释保持为黑色文本,采用粗体格式但不使用斜体,可以进一步实现这一点。以下是相同的 CRF 页面,说明了 SDTM-MSG v1.0 和 SDTM-MSG v2.0 之间的区别。

3.1.3 注释特定类型的数据
注释结果
由于 SDTM 结果域的垂直性质,可能还需要在注释中提供“--TESTCD”。例如,将字段批注为简单的 VSORRES 或 VSORRESU 可能并不总是足够的,可能还需要指示 VSTESTCD 以确保显式上下文。以下示例显示了同一 Vital Signs CRF 页面的 2 种注释方法。在示例 1 中,CRF 在单个注释中使用 “--ORRES when --TESTCD=” 格式进行注释&lt;value&gt;。在此示例中,CRF 页面有大量可用空间来应用这种注释方法。但是,某些 CRF 页面可能不允许此数量的空白,在这种情况下,可能需要其他注释方法。在示例 2 中,即使 CRF 页相同,它也对 VSTESTCD 和 VSORRES 使用单独的注释。这两个示例都被认为是可以接受的。

补充限定符
在注释补充限定符变量时,注释 QNAM 值和补充限定符域(例如,“RACEOTH in SUPPDM”)。此方法的基本原理是,潜在的审核工具可以将补充限定符值与父域中的正确数据行联接。这将允许审阅者知道变量名称是什么,以及它源自补充数据集。请参阅示例 aCRF 的 Exposure (曝光) 页面中的以下示例。

RELREC
当表单指示收集的数据之间的关系时,注释应指示集合以及 RELREC 关系。在样本提交包中,不良事件收集在不良事件 CRF 页面上,其中 AE ID 号收集为 AELNKID。如果受试者的处置、死亡或有关记录的发现与 AE 相关,则 AE ID 也会收集在这些页面上,从而在这些记录和 AE 之间建立关系。应使用约定“RELREC when &lt;collected variable&gt; = &lt;related domain variable&gt;”来注释 RELREC,以指示该关系。有时,如果变量名称未指示域,则可能需要在变量名称之前添加域前缀;例如,“OE.FOCID“, ”AE.FOCID”。以下示例显示了死亡详细信息页面,其中 AE ID 号作为 DDLNKID 收集,它与 AE 相关。

Example 1: Annotations for RELREC

3.1.4 替换或弃用页面
在样本提交包中,3 个生命体征 CRF 页面中的每一个都有 2 个版本。每个页面的第一个版本(由 CRF 页面右下角的“1.0 版”表示)仅收集一次血压和脉搏。更新后的页面(“版本 2.0”)一式三份收集了这些 Vitals。由于两个版本的页面都用于收集数据,如果两个 CRF 版本都不可用给审阅者,则在审阅过程中可能会造成混淆,因此这两个版本都包含在样本提交中。从带注释的 CRF 中可以看出,新版本被放置在旧版本旁边,并且版本在书签和提供的目录中标识。申办者可自行决定是否将替换页面作为带注释的 CRF 的一部分。

最佳实践

出于可追溯性目的,申办者可能需要包含一个 CRF 页面,该页面用于收集数据,但后来由于协议更改或其他原因而被弃用,作为带注释的 CRF 的一部分。申办者有多种方法可以处理这种情况,他们应该选择如何在其注释的 CRF 中最好地表示这种情况。这也应在 cSDRG 中进一步解释。

3.2 为 CRF/eCRF 添加书签
eCTD 中包含的带注释的 CRF 应通过双重书签添加书签:(1) 按时间顺序添加书签,(2) 按 CRF 主题或表格添加书签。(术语“主题”和“表单”是指 CRF 的内容,而不是 SDTM 域。双重书签的目的是增强审阅者按时间顺序或 CRF 主题浏览唯一 CRF 的能力。SDTM 域的数据不一定与 CRF 主题或表单有一一归真的关系,反之亦然。例如,在带注释的 CRF 中,人口统计 (DM) 和处置 (DS) 的数据都在 DM CRF 页面上收集。有关为替换和/或已弃用的 CRF 页面添加书签的建议,请参见部分 3.1.4, 替换或弃用的页面。

一般说明:

为非传统数字馆藏源添加书签SDTM-MSG v2.0 不提供有关为非传统数字馆藏源(例如 ePRO)添加书签的建议。在这种情况下,申办者应遵循各自的标准操作程序和/或指南。

• 按时间顺序排列的书签应根据活动研究计划 (SOA) 进行排序。

        o 独立于访问的页面(例如,不良事件)应最后显示在“Running Records”书签下。

        o 在每个按时间顺序排列的书签中,主题书签应按照它们在带注释的 CRF 中出现的顺序出现。

• 按主题划分的书签可以按字母顺序排序,就像在 SDTM-MSG 样本提交包中所做的那样,或者赞助商可以选择按照它们在 CRF 中出现的顺序列出表格。

        o 在每个主题中,书签应根据 SoA 计划按时间顺序排序。

        o 对于 SDTM-MSG v1.0,aCRF 示例将“域”显示为这些书签的顶级,但 SDTM-MSG v2.0 已将其更改为“表单”,因为“域”意味着 SDTM 域。

• 以下是按时间顺序和形式排列的书签示例。在图像中,在“访问”书签下方,用于筛选访问 1 和 2 的书签显示了这些访问中使用的 CRF 页面,这些页面按它们在 CRF 中的显示顺序列出。在“Forms”书签下方,“Auditory Verbal Learning Test (AVLT-REY)”书签有子书签,显示使用该表单的访问。“Conpositant Medications” 书签有一个子书签,表示它是 “Running Record”。

3.3 带注释的 CRF 的目录
在带注释的 CRF 中,书签基本上包含供审阅者使用的目录 (TOC)。为了促进更有效的审查过程,可以在带注释的 CRF 的开头包含一个可打印的 TOC(参见以下示例)。目录中的条目应超链接到相应的 CRF 页面,就像对相应的书签所做的那样。有几种免费的商用数字工具可以支持通过利用现有书签来创建 TOC。也可以使用文字处理软件创建 TOC,就像在带注释的 CRF 样本提交包中所做的那样。

4 临床研究数据审阅者指南
cSDRG 为审阅者提供有关提交数据的其他信息,这些数据不属于 Define-XML 文档和/或带注释的 CRF。cSDRG 应通过描述任何特殊注意事项(包括从表示角度与 Define-XML 不兼容的复杂算法)来帮助促进审查过程。虽然监管机构(例如美国 FDA 或 PMDA)没有明确要求审稿人指南的具体格式,但可能会引用 PHUSE 模板。请参阅 PHUSE 网站以获取最新的 cSDRG 版本 (https://www.phuse.eu/css-deliverables)。PHUSE cSDRG 包中包含模板、完成指南和示例 cSDRG。SDTM-MSG 不会重复 PHUSE cSDRG 中描述的所有具体细节。

一般说明

在 SDTM-MSG v2.0 发布时,美国 FDA 规定 cSDRG 应命名为“csdrg.pdf”,而 PMDA 规定它可以命名为类似于“study-data-reviewers-guide.pdf”。MSG 团队在样本提交中将审稿人指南命名为“csdrg.pdf”,但申办方应查看其监管机构的最新建议。

4.1 一致性、验证和工具
预计申办者在整个提交开发生命周期中对研究数据包进行合规性检查,以便尽早发现问题。合规性检查将在审稿人指南的上下文中讨论,因为这是在最终提交研究数据包中解释其余触发的检查的地方。

• 应根据 Define-XML 一致性规则验证 Define-XML 文档。

• 应根据 SDTM 一致性规则使用 Define-XML 验证 SDTM 数据。

• 在审查 SDTM 数据的一致性时,必须评估任何发现。

        o 通常属于申办者控制范围的所有一致性调查结果(例如,数据集和变量属性)都应予以纠正。

        o 任何无法解决的一致性调查结果都可以在 cSDRG 中解释。

▪ 对于生产中的一致性规则,应包含相应的规则 ID(如果可用)。

        o 每个监管机构可能都有自己的一套业务要求,用于评估一致性和验证,以及要在 cSDRG 中记录的调查结果的范围。

• 可以采用多种方法来评估 SDTM 数据的一致性。

        o 可以使用第三方工具。这些工具可能对格式正确的 SDTM 数据集的要求有自己的解释。申办者应理解并评估这些解释。

        o 应在 cSDRG 中注明与要求解释相关的验证问题。

• 申办者应付出额外的努力来解释他们当前的合规性检查。

        o 申办者在为合规性检查提供解释时,应注意避免使用笼统的解释,或简单地重复合规性检查措辞的解释。例如,在响应触发指示重复记录的检查时,仅说明记录不是重复记录是不够的。相反,诸如“验证工具检查 CESTDTC、CECAT、CETERM 和 USUBJID 的唯一性,但当前数据也需要考虑 CESCAT”之类的响应为审阅者清楚地解释了问题。

        o 提供更多详细信息可以帮助监管卫生机构和相应的审查部门了解确定的合规性检查的原因。

4.2 其他文件
其他文件可由赞助商酌情作为单独的 PDF 包含在内。在单独的 PDF 中表示的适当材料示例包括为支持问卷而提供的复杂评分材料,或与肿瘤学相关的推导。

SDTM-MSG v2.0 示例提交包不包括这些文档的示例。Define-XML 文档应具有对这些文档的显式引用;赞助者可以参考 Define-XML 文档了解更多详细信息。

5 提交数据集
本节的目的是突出 SDTM-MSG 示例提交包中域值得注意的方面。由于这些是示例,因此以下小节可能描述 MSG 团队做出的实现选择。此部分中域的顺序遵循域在 define.xml 文档中显示的顺序。

5.1 试验设计
图 1 描述了样本提交研究的整体试验设计,该研究大致基于原始的 CDISC SDTM/ADaM 试点项目。

Figure 1. CDISCPILOT01 Trial Design

如图 1 所示,在第 24 周之前停药的受试者安排在第 24 周进行访视(即早期停药回忆访视)。对于那些没有停止的人,该访问发生在第 12 次访问的同一时间点。

注意:

• 在研究中停止但返回进行早期停药回忆访视的受试者仍留在治疗时期。

• 电视中没有 VISITNUM = 6。SDTMIG 不要求 VISITNUM 值是连续的,只要求按时间顺序(对于非或有访问)。

如图 1 所示,样本提交中有 3 个臂。每个臂都从一个屏蔽元素开始;低剂量扎诺马林和安慰剂组只有一个给药元件,而高剂量扎诺马林组有 3 个给药元件。所有 3 组的给药周期均为 26 周,高剂量在长达 22 周的高剂量元件之前和之后具有 2 周的滴定元件。

5.1.1 试验纳入/排除标准 (TI)
如何表示超过 200 个字符的标准是申办者的决定;它们可以在 200 个字符处截断,也可以将有意义的文本放入 IETEST 中。在示例提交中,MSG 团队决定使用有意义的文本方法。

一些原始方案标准远远超出了 200 个字符的限制(例如,排除标准 12 的长度为 485 个字符;排除标准 31 的长度为 2199 个字符)。全文见研究数据审稿人指南 (csdrg.pdf) 的附录 1。由于这些标准具有多个列举的子标准,因此决定文本无法用 200 个字符来传达标准的全部含义。因此,在 IETEST 中引用了该协议,以表明需要从协议中获取全文才能理解。EXCL12 的 IETEST 设置为“严重神经系统疾病的诊断(见方案)”,EXCL31 的文本设置为“入组前 1 个月内药物治疗(见方案)”。在协议修正案中,这些标准增加了额外的项目。通过将每个标准中的“(见协议)”文本更改为“(见修正案 1)”来表示这一点,这确保了明确需要引用协议才能理解全文,并为更新的标准提供新的 IETESTCD 和 IETEST 值(更新标准时需要)。

请注意,尽管由于版权许可而更换了一些 QRS(问卷、评级和量表)设备,但研究中使用的原始纳入/排除标准在样本提交中保持不变。这些标准有时参考原始 QRS 装置。

5.1.2 试验总结 (TS)
对于样本数据中的 TSPARMCD = “FCNTRY”,使用了“ISO 3166”,但如果提交给 FDA,则将使用地缘政治实体、名称和代码标准 (GENC),并且 FCNTRY 行将类似于以下内容(取决于使用的 GENC 版本):

由于研究药物是虚构的,并且研究数据松散所依据的研究发生在 ClinicalTrials.gov 系统 (https://clinicaltrials.gov) 开发之前,因此 TRT 和 REGID 的代码值也是虚构的。

5.2 特殊用途域
5.2.1 人口统计 (DM)
在样本提交中,受试者被分配了“CDISC001”到“CDISC018”的 USUBJID 值。这不应被视为建议,而是说明申办者可以自由地以他们希望的方法分配 USUBJID 值,并且 STUDY-SITE-SUBJID 的通常串联不是必需的。当然,这是假设在整个应用程序中为每个单独的主题分配一个唯一标识符。

5.3 干预措施
5.3.1 收集的暴露量 (EC) 和暴露量 (EX)
EC 代表收集的暴露数据,它包含以“mL”为单位的研究药物 (ECDOSE) 注射量 (ECDOSU),以及以“g/L”为单位的溶液强度 (ECPSTRG) (ECPSTRGU)。溶液的强度在给药时是盲法的,但与剂量一起用于计算 EX 中研究药物的总剂量 (EXDOSE),从而得出方案指定的单位“mg”(EXDOSU)。实际剂量由受试者记录在日记中,并由站点转录到 EC 集合 CRF 上。许多 EX 变量(例如,EXTRT、EXDOSFRQ、EXDOSFRM、EXROUTE、EXLOT)直接从它们在 EC 中的等效变量复制,因此在示例 Define-XML 文档 (define.xml) 中给出了“前身”的来源。尽管“前置任务”主要被视为 ADaM 的源,但它也可用于 SDTM 方案,例如 EC/EX。尽管 SDTMIG v3.2 未将“Predecessor”指定为允许的源值之一,但 Define-XML 规范是源值的实际源。即使在 3.2 中,“Predecessor”也可以在 SDTM 中使用,就像在 v3.3 MSG 样本提交中一样。

5.4 事件
5.4.1 不良事件 (AE)
有 2 种 AE CRF,一种用于自发报告的 AE,一种用于注射部位反应 (ISR)。ISR 的 AETERM 默认为“注射部位反应”,而反应、疼痛、硬结等的详细信息包含在“关于事件或干预的调查结果 (FA)”域中。RELREC 用于显示域之间的关系。

由于编码词典的专有性质,样本提交中的 AE 编码变量均为 null,但申办方应继续按预期填充这些变量。

5.5 结果
基线访视时的研究程序是方案规定的,在研究给药之前进行。由于在基线访视(受试者从筛选时期转移到治疗时期的时间点)的第一次给药时未收集时间,因此在基线访视时收集的所有发现数据都被视为发生在筛选时期。

5.5.1 实验室检测结果 (LB)
样品提交包括因文件大小而需要拆分 LB 的情况,并说明了符合 FDA 在研究数据技术一致性指南 (https://www.fda.gov/media/88173/download) 中概述的建议。申办者应咨询其他监管机构,了解有关拆分数据集的要求。为了使整个提交包的大小保持方便,LB 的实际文件大小不足以需要拆分,而只表示如何处理这种情况。在示例提交中,LB 包含在“sdtm”文件夹中,并在 Define-XML 文档中表示为单个表。然后按类别 LBCAT 将 LBCH 分为 LBCH(“化学”)、LBHE(“血液学”)和 LBUR(“尿液分析”和“其他”)。拆分数据集不需要额外的 Define-XML 文档。

5.5.2 神经系统发现 (NV)
NV CRF 页面被添加到 MSG 样本提交中,纯粹作为计划域 NV 的示例,该域未收集任何数据。

5.5.3 问卷、评分和量表 (QRS)
在以前版本的 SDTMIG 中,功能测试和临床分类被认为是 QS 领域的一部分。在 v3.3 中,它们从 QS 域中删除,功能测试形成 FT 域,临床分类成为疾病反应和临床分类 (RS) 域的一部分。

用于 FT 领域的功能测试是 Rey 听觉语言学习测试 (AVLT-REY),基于 QRS 补充,该补充发布在 CDISC 网站 (https://www.cdisc.org/standards/foundational/qrs)。AVLT-REY 涉及从 15 个单词的列表中进行听觉回忆:列表 A,重复 5 次;然后召回第二个列表(列表 B);第六次召回名单 A;然后,在延迟 30 分钟后,第七次召回名单 A。列表 A 的 7 次重复是在 FTREPNUM 变量中捕获的,而列表 B 的 FTREPNUM 为 null,它只执行一次。为了在最终调用列表 A 之前捕获所需的 30 分钟延迟,使用了时间点变量。FTELTM 设置为 PT30M,而 FTTPTREF 中的值设置为“LIST A RECALL 6”。

与样本提交的实验室测试结果 (LB) 场景不同,在示例中,由于域的大小而需要使用唯一的整体数据集定义对域进行拆分,而 QS 域则作为由申办方决策进行的拆分示例进行拆分,每个拆分组件具有不同的数据集定义。因此,与 LB 不同,LB 将数据集作为一个整体包含在 Define-XML 文档和 “sdtm” 文件夹中,而拆分版本仅包含在 “split” 文件夹中,而 QS 作为单独的数据集定义包含在 QSSL(生活满意度调查)和 QSPH(患者健康问卷 9)的 Define-XML 文档中,并且仅在 “sdtm” 文件夹中包含单独的物理数据集。

QSSTRESC 和 QSSTRESN 在 QS CRF 页面上进行注释,即使它们被视为派生变量。它们被认为是有用的注释,可以使数据更容易理解,但这并不能使它们成为 CRF 收集的数据。原点值将保持“派生”,页码将添加到 Define-XML 文档中,以表明 CRF 注释可以帮助阐明数据。

最佳实践即使变量不被视为 CRF 收集的数据,也可以添加注释来帮助解释数据。例如,注释 RSEVLINT 和 RSCAT,就像在 HAMD-17 RS 页面上所做的那样,可以使审阅者更容易理解 CRF 页面,即使数据不被视为 CRF 收集的(见下文)。

5.5.4 生命体征 (VS)
如第 3.1.4 节 替换或弃用页面中所述,有 3 个不同的 VS 页面,用于不同的访问。除了脉搏和血压测量外,1 页还收集了体温;1 采集温度和重量;1 个收集温度、体重和身高。在 2012 年底的试验期间,这些页面中的每一个都进行了更新,更新版本将脉搏和血压一式三份,迭代由 VSREPNUM 表示。

6 附录
附录 A:CDISC SDS MSG 团队

<略>

附录 B:提交包软件问题
浏览器显示/功能问题
根据 Adobe 版本和浏览器及其设置,用户可能会遇到书签功能问题,或者在呈现的 XML 中观察到显示和功能问题。调整浏览器设置可以纠正这个问题,但由于组合太多,本文档不可能描述它们全部。
可搜索性
通常,在查看带注释的 CRF 时,搜索特定变量或域很有用,但是当在浏览器中打开 PDF 时,搜索注释的功能可能不可用。

附录 C:MSG包免责声明

<略>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值