将数据添加到指定列_学习R:识别缺失值与将指定数据编码为缺失值

237ca37ba5fed97405ae36735cb9cd2d.png

基础不牢,大厦将倒。今天再来练习一个基础操作,在数据框中发现缺失值,以及将指定数据重编码为缺失值。

雇员数据原本是SPSS格式,其中以往经验这个变量有一小部分取值为0的,即无经验,假设我们现在要将其认定为缺失值,需要重新将数字0认定为缺失值。

70e57bb46e672ee016707991461e5db0.png

第一,查看当前数据有无缺失值

summary(is.na(data))

fdaaf50b9c0ef4036c2b873fd97b8574.png

或者

sum(is.na(data))# [1] 0

该数据总共474case,结果显示,整个data没有系统缺失值。

但实际需求是,我们要将prevexp变量中的数字0设定为缺失值,应该强行定义。

第二,指定值冲编码为缺失值

data$prevexp[data$prevexp == 0]

data$prevexp[which(is.na(data$prevexp))]

此时0经验已经被我们强行编码为系统缺失值NA。

第三,识别缺失值

summary(is.na(data))

来看现在的结果:

bdefe3d048f4f5a582eaf1c307636e63.png

有24个0被我们强行定义为NA即缺失值。

本文完

文/图=数据小兵

更多R统计文章

R语言单一样本t检验案例实现

R语言的正态密度曲线很美

R自带pairs函数矩阵散点图

car包spm函数矩阵散点图用R语言pie函数做饼图

ggplot2统计图形:常见的4种箱线图

ggplot2统计图形:常见的4种直方图

按列索引按列名称删除指定的列数据R语言Levene方差齐次检验table函数:分类数据的频数与频率统计

jiebaR包中文分词及词云制作

R语言带文字标签的散点图如何获取R自带数据集与R包数据集说明文档?

如何修改R数据框的列名称?二元正态分布及双变量相关分析简单案例演示

R语言相关系数、显著性检验及可视化的尝试

ggplot2统计图形:常见的4种散点图R语言scale()函数实现数据标准化用R语言做单因素方差分析及多重比较用R语言自动智能化创建时间序列ARIMA模型

用R对连续数据做描述统计R语言主成分分析

shapiro.test()与ggqqplot()做正态分布检验 Fleiss' Kappa系数处理多个观察者一致性检验 练习R:用ggpubr包ggline绘制线图 双因素方差分析如何做非参数检验替代方法? dplyr包实现分组描述统计 连续数据探索性统计可视化函数EDA 用lm.ridge()做岭回归分析 lm+plot+abline+text函数绘制线性拟合散点图 分类自变量的线性回归 factor函数为有序分类变量创建值标签 5ccce1c67eeb3ce05e6350afb6dd33f7.png

END

5ccce1c67eeb3ce05e6350afb6dd33f7.png 844a9c3bef69b1d7a9350bc70d6b9d81.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值