[R数据预处理] 数据清洗: 删除重复数据、剔除空值和清除串前后空格

1. 删除重复数据 unique (x)

> a<-round(runif(30,10,20))  #生成有重复值得数据
> a
 [1] 19 10 13 15 16 13 14 14 19 11 11 20 14 14 12 11 17 16 20 16 11 12
[23] 15 10 14 13 19 17 12 15
> data<-write.csv(a,'data.csv',row.names=F)  #写文件
> newdata<-read.csv('data.csv')         #读文件
> > unique(newdata)       #删除重复项
    x
1  19
2  10
3  13
4  15
5  16
7  14
10 11
12 20
15 12
17 17

2. 剔除数据结构中值为空(即缺失值以NA表示)的数据 na.omit (x)

> a<-5:15
> a[18]<-18
> a
 [1]  5  6  7  8  9 10 11 12 13 14 15 NA NA NA NA NA NA 18
> na.omit(a)
 [1]  5  6  7  8  9 10 11 12 13 14 15 18
attr(,"na.action")
[1] 12 13 14 15 16 17
attr(,"class")
[1] "omit"

3. 清除字符型数据前后的空格trim (x)

trim 函数来自 raster包,使用前,先使用 install.packages(“raster”) 安装,再使用 library (raster) 引入该包。

install.packages("raster")
library (raster) 
> a<-'  hello   world  '
> data<-trim(a)
> data
[1] "hello   world"  #字符串中间的空格不处理
  • 6
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值