多重填补

数据缺失机制的分类

  • 完全随机缺失
    数据的缺失不依赖任何测量值。
    如受试者因为工作原因从一个地方搬到另外一个地方,远离了原来的研究中心而无法继续试验。
  • 随机缺失
    数据的缺失依赖于已经观测到的测量值,而不依赖于未观测到的测量值。
    如受试者在临床试验中因为疗效不好从而退出试验。
  • 非随机缺失
    数据的缺失依赖于未观测到的测量值。
    如受试者在之前的访视中一切良好,然而在某次访视后疾病恶化从而退出试验。

当数据缺失是完全随机缺失或者随机缺失的时候,根据现有的试验数据做出的统计推断依然是有效的(尽管不会像完整的数据那么有效)。如果数据缺失是非随机缺失的,根据现有的数据做出的统计推断很有可能会产生偏倚。

数据缺失模式的分类

在这里插入图片描述

多重填补(MI)

给每一个缺失值都构造m个填补值,产生m个完整数据集,对每个完整数据集分别使用相同的方法进行处理,得到m个处理结果,再综合这m个结果,最终得到对目标变量的估计。
多重插补并没有试图去通过模拟值去估计每个缺失值,而是提出缺失数据值的一个随机样本,借此估计变量的实际后验分布,这反映了缺失值引起的不确定性。
在这里插入图片描述
插补方法有多重回归填补法(Multiple Regression Imputation)、倾向得分法(Propensity Score)和马尔科夫链蒙特卡罗法(Markov Chain Monte Carlo,MCMC),由于多重回归填补法和倾向得分法一般运用在数据呈单调缺失的模式中,MCMC 法用于任意缺失模式的连续型变量数据,而临床试验中,临床数据一般是任意缺失的,因此主要运用马尔科夫链蒙特卡罗法
在这里插入图片描述

马尔科夫链蒙特卡罗法

MCMC法是Bayes理论中探索后验概率分布的一种方法,使用MCMC对数据缺失进行多重填补时有以下假设:
假设数据是随机缺失的、是任意缺失的、服从多元正态分布

填补步骤:
(1) 填补步(imputation step)
每一个迭代过程均以给定的均值μ和协方差矩阵∑开始,从条件分布中为缺失值抽取替代值。

(2)后验步(posterior step)
通过填补步中得到的完整数据估算出整体的均值和方差矩阵,将这些新估算出的数值再次循环应用到填补步中。通过填补步和后验步迭代多次后,得到一个比较稳定的数据集,最终通过迭代数次,使得结果收敛,得到一个稳定的分布。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
当没有缺失数据时,填补间方差B=0,B的大小反映了与观察到的数据相比,缺失数据相对包含了多少信息。α和r揭示了Q的估计在多大程度上受到了数据缺失的影响。可依据这些指标选择m。

  • 6
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
多重填补(Multiple Imputation)是一种处理缺失数据的方法,在MATLAB中也有相应的函数可以实现。你可以使用MATLAB的fillmissing函数来进行多重填补。具体使用方法如下: 1. 首先,定义一个包含缺失值的矩阵A,例如:A = [5,NaN,7,NaN,3]。 2. 然后,使用fillmissing函数进行填补操作,指定填补方法为'movmean',并设置窗口大小为3。例如:F = fillmissing(A,'movmean',3)。 这样,MATLAB会根据指定的填补方法和参数对缺失值进行填补,返回填补后的矩阵F,其中缺失值被相应的填补值替代。 需要注意的是,MATLAB中没有直接计算F1分数的内置函数,但你可以在MATLAB Central的文件交换平台上找到其他人编写的代码来计算F1分数。可以参考给出的链接来获取相关的代码和使用说明。 请记得将相关函数放到MATLAB的工作文件夹下,以确保正确的运行。 参考文献: MATLAB官方文档:https://ww2.mathworks.cn/help/matlab/ref/fillmissing.html Eugenio Bertolini (2021). Precision, Specificity, Sensitivity, Accuracy & F1-score (https://www.mathworks.com/matlabcentral/fileexchange/86158-precision-specificitysensitivity-accuracy-f1-score), MATLAB Central File Exchange. Retrieved August 5, 2021.<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [MATLAB&机器学习进阶](https://blog.csdn.net/qq_53471484/article/details/125583898)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [MATLAB数据预处理之缺失值插补](https://blog.csdn.net/WANGSIRHHXI/article/details/114819183)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值