《实用医学统计学与SAS应用》学习笔记 | 实验设计

最新推荐文章于 2025-05-14 13:07:11 发布

生信修炼手册

最新推荐文章于 2025-05-14 13:07:11 发布

阅读量747

点赞数

文章标签：学习人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzIwODA1MzI4Mg==&mid=2456017806&idx=1&sn=c8541e4521d0e4cb3db59b698f959087&chksm=809f8ec3b7e807d5c3b9987804ba0d42f16a1cefb641f71d267e18f68092f97a41a21390462d&scene=126&sessionid=0

版权

1. 实验研究的特点及分类

实验研究的特点

1）处理因素可以根据研究目的人为设置

2）受试对象可以随机分配到各组中去

3）研究过程中除了处理因素不同外，其他干扰因素能够在一定程度上控制齐同

4）若各组间研究结果有差别，并且该差别经统计检验后排除抽样误差的可能性，则可以认为这个差别是由于处理因素所致

实验研究的分类

1）按照研究对象分类

实验室研究：受试对象是动植物或者来自人的血液，尿液等标本

临床试验：受试对象是患者和志愿者

社区试验：受试对象是整个社区未患所研究疾病的正常人群

现场试验：受试对象是未患所研究疾病的正常个体

2）按处理因素个数，处理水平和是否考虑交互作用分类

单因素设计: 包括完全随机设计，配对设计

两因素设计: 包括配对设计，配伍组设计等

三因素设计: 包括拉丁方设计，裂区设计等

多因素多水平设计: 包括析因设计，正交设计，均匀设计等

考虑交互作用你的设计:包括因设计，正交设计等

2. 实验研究的基本要素

处理因素：根据研究目的而确定欲施加或欲观察的，并能引起受试对象产生直接或间接效应的某个特定因素，因素在试验中所处的状态或不同的等级，称为因素的水平，也称处理水平

注意事项：

1）处理因素要标准化，确保处理因素在整个实验过程中始终保持不变

2）分清处理因素与非处理因素，处理因素取决于研究者，根据研究目的而确定;非处理因素取决于受试对象自身，主要指不能人为改变的，可能对实验结果有影响的因素，在实验研究中要通过排除，平衡或标准化的方法控制非处理因素，突出处理因素的主要作用

受试对象：处理因素作用的客体，可以是人，动植物，也可以是某个器官，组织或细胞等生物材料

实验效应：处理因素作用于受试对象后产生的反应或结局，可以由观察指标来反映

观察指标的选择关系研究成败，应当考虑以下三个方面

1）主客观性，尽可能用客观指标，少用或者慎用主观指标

2）灵敏性和特异性，灵敏度是指检出真阳性的能力，特异度是指检出真阴性的能力

3）准确度和精密度，准确度是指观察值与真实值的接近程度，也称为真实性，有效度;精密度是指用同一方法多次测量后各个测定值与平均值接近的程度，属于随机误差，用标准差或者变异系数来表示

3. 实验设计的基本原则

对照原则: 除了试验组外，同时设置一个或对个对照组进行实验，常用的对照包括

1）空白对照:对照组不施加干预，对照组的处理因素为"空白"

2）实验对照:对照组不施加要研究的处理因素，但施加某种与处理因素有关的实验因素

3）标准对照:对照组采用现有标注方法或常规方法，或者不专门设立对照组，以标准值或正常值为对照

4）自身对照:三种形式，实验与对照在同一个个体上进行;同一份标本分为两份，分别接受对照组和实验组处理; 条件相同或相似的受试对象配成对子后，随机分为对照组和实验组，即配对设计

5）相互对照:不专门设计对照组，而是各实验组之间互为对照

6）文献对照:也称为历史对照，不专门设立对照组，只是以过去的研究结果与本次研究结果做比较

重复原则：通过多次实验或者多次观察来提高实验的可靠性和科学性，包含以下三种类型的重复

1）整个实验的重复:确保实验的重现性，不可重复的研究没有科学性

2）多个受试对象的重复:足够的样本含量结论更可信

3）同一受试对象的重复:保证观察结果的精密度

随机化原则: 采用随机的方式，使每个受试对象都有同等的机会被抽取或分配到试验组和对照组，科室难以控制的诸多非处理因素在各组中尽量保持一致，其操作有以下三种形式

1）随机抽样：总体内每一个对象被抽入样本的概率相等，保证抽得的样本对总体具有代表性

2）随机分组：每个实验对象均有相同概率被分配到实验组和对照组，保证组间的均衡性，即非处理因素在各组间的分布尽量一致

3）随机顺序：每个受试对象接受处理的先后机会均等，从而平衡实验顺序的影响

4. 样本含量的估算

样本含量：又称样本量，是在研究的样本中所包含观察对象的数量

样本量估计：最小样本需要量，在保证研究结论具有一定可靠性的条件下，确定最少的研究对象个数，由于影响样本量的因素较多，不可能算出一个确切数值，所以估计只能提供一个近似的数值

影响样本含量估计的因素：不同的统计分析方法要求不同的样本含量，假设检验是最常用的统计分析方法，进行假设检验所需样本量取决于以下4个方面的因素：

1）统计检验的I型错误率(α): 又称检验水准，根据研究目事先确定，比如常用的检验水准0.05, 其值越小，所需的样本含量越大

2）统计检验的II型错误率(β): β越小，所需样本量越大，1-β称为检验功效，一般要求检验功效在0.8以上，所以β常取0.2， 0.1或0.05

3）容许误差δ：即样本统计量与总体参数间的差值，差值愈大，越易分辨，所需样本量越小

4）总体变异度：即标准差σ，标准差越小，抽样误差越小，所需样本量越小

注意事项：

1）样本含量的估算:所谓估算只是一个估计值，不是一个确切数

2）考虑其他因素：当偶然误差过大，难以控制时，可在估算的样本含量的基础上增加10%-20%;考虑样本脱落问题，也需要增加一定的例数

3）有关阴性结果:假设检验的p值大于α时，结论为差别无统计学意义，即阴性结果，但是这个结论有可能是由于样本量较小，随机误差较大导致的假阴性结果，即统计学上的II型误差β，因此对于阴性结果必须综合其β值作为参考，β过大时的阴性结果并不可靠

5. 常用的几种实验设计的方法

完全随机设计：将受试对象随机分配到各组中进行实验或观察，是研究单因素的一种常用的实验设计方法，研究因素有多少个水平，就将研究对象随机分为多少组

配对设计：将条件或性质(即非处理因素)十分相似的受试对象配成对子，再将每对中的两个受试对象随机分配到不同组，该设计方法可以控制非处理因素(混杂因素)对实验结果的影响，同时增加组间的均衡性，提高实验效率

随机区组设计：也称配伍组设计，将条件或性质(即非处理因素，又称区组因素)相似的受试对象配成一个区组，然后区组内每个受试对象再随机分到各个比较组，分别接受不同处理

交叉设计: 让受试对象按事先设计好的实验次序在各个不同时期分别接受不同的处理，然后比较处理因素间的效应差异，是一种特殊的自身对照设计，可以控制时间因素和个体差异对处理因素的影响，检验效率较高

拉丁方设计：可以看成是区组设计的扩展，扩展到可以平衡多个非处理因素变量，以防止这些变量称为混淆因子，破坏研究的内部效度

析因设计：适用于研究因素间存在交互作用的情况，该设计方法将两个或多个因素的各个水平进行组合，对所有可能的组合都进行实验

正交设计：通过使用一套规范化的正交表和交互作用表来安排试验因素和水平，根据正交性从全面试验中挑选出部分有代表性的点进行试验

重复测量设计：在给予一种或多种处理后，同一受试对象的同一观察指标在不同时间点上进行多次测量所获得的观察指标值，来自同一受试对象的观察资料，彼此间缺乏独立性，称为受试者内因素;在受试对象中，部分仅接受处理因素的某个水平，或仅具有某个特征，此因素称为受试者间因素。

6. 临床试验设计

临床试验：是以人体(病人或正产人)作为研究对象的医学实验研究，经过严密的研究设计将某种新药(或新疗法)在少数人中试用，以证实或揭示其对人体的疗效优劣，不良反应及药物在人体内的吸收，分布，代谢和排泄的一系列动力过程，是以人体为研究对象的干预性研究。

盲法：用于纠正由受试者的主观感觉和研究者的主观判断导致的偏倚，避免这些主观因素对试验结果的评价造成干扰，包括以下几种形式

1）双盲：研究者和受试者在整个试验过程中都不知道受试者接受的是何种处理

2）单盲：受试者不知道自己接受的是何种处理，而研究者是知道的

3）非盲：研究者和受试者都知道具体治疗方案

4）安慰剂：安慰剂是一种虚拟药物，大多数特征与研究药物保持一致，但不含研究药物的成分，对对照组使用安慰剂可以实现盲法

临床试验的统计分析集：统计分析集是指在结果的统计分析时，哪些受试者应当包括在内，哪些受试者不应当包括在内，包括以下几种

意向性分析: ITT, 原则是指主要分析应包括所有经随机化分组的全部受试者

全分析集: FAS, 是对意向性分析的最好接近，以最小和合理的方式剔除受试者后的数据集

符合方案集: PPS,全分析集中更加符合试验方案的受试者子集，一般包括完成最小剂量的药物治疗，依从性好，完成主要疗效指标观察的受试者

安全评价集: SS, 用于安全性评价的数据集，应包括所有随机化后至少接受一次治疗的受试者

临床试验的评价：首先需要整理出如下所示的四格表

常用的评价指标：

除了以上指标外，常用的评价方法还包括ROC曲线。

ROC曲线：即受试者工作特征曲线，它是以每一个检测结果作为可能的诊断界值，计算相应的真阳性率和假阳性率，以假阳性率为横坐标，以真阳性率为纵坐标绘制而成的曲线，其曲线下面积的大小表明了诊断试验准确度大小。

ROC曲线下面积的取值范围为0.5-1，对于一个诊断试验，ROC曲线下面积为0.5-0.7时诊断价值较低，为0.7-0.9时诊断价值中等，在0.9以上时诊断价值较高。

·end·

—如果喜欢，快分享给你的朋友们吧—

原创不易，欢迎收藏，点赞，转发！生信知识浩瀚如海，在生信学习的道路上，让我们一起并肩作战！

本公众号深耕耘生信领域多年，具有丰富的数据分析经验，致力于提供真正有价值的数据分析服务，擅长个性化分析，欢迎有需要的老师和同学前来咨询。