r语言插补法_R语言| 缺失值的处理方法——多重插补法:利用mice()包

本文介绍了R语言中处理缺失值的多重插补法,通过mice包进行插补建模,包括基本思想、mice函数的使用、应用示例以及常见问题解答。通过mice函数的参数设置,如多重插补数、插补方法等,进行数据集的完整化处理,并展示了如何评估插补模型和查看插补结果。
摘要由CSDN通过智能技术生成

从今天开始要记录自己的学习笔记啦~~~ 2020.3.5

缺失值的处理方法——多重插补法

1 基本思想

利用蒙特卡洛模拟法(MCMC)将原始数据插补成几个完整数据集,在每个数据集中利用线性回归(lm)或广义线性规格(glm)等方法进行插补建模,再将这些完整的模型整合到一起,评价插补模型的优劣并返回完整数据集。该方法主要利用程辑包mice中的mice( )进行。

大致步骤如下:

缺失数据集——MCMC估计插补成几个数据集——每个数据集进行插补建模(glm、lm模型)——将这些模型整合到一起(pool)——评价插补模型优劣(模型系数的t统计量)——输出完整数据集(compute)

2mice函数基本书写格式

R语言输入help(mice)可获取详细信息

mice( data, m=5, method=vetor(“charater”,length=ncol(data)), seed=NA,defaultMethod=c(“pmm”,“logger”,“polyreg”,“poor”)…)

data:一个包含完整数据和缺失数据的矩阵或数据框

m:指定的多重插补数,默认值为5

method:一个字符串,或者长度与数据集列数相同的字符串向量,用于指定数据中的每一列采用的插补方法,单一字符串指定所有列用相同的方法插补,字符串向量指定不同列采用不同的方法插补,默认插补法取决于需要插补的目标列,并由defaultMethod指定参数

seed:一个整数,用于函数set.seed( )的参数,默认值为NA

defaultMethod:一个向量,用于指定每个数据集采用的插补建模方法,可供

  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值