1. 删除重复数据 unique (x)
> a<-round(runif(30,10,20)) #生成有重复值得数据
> a
[1] 19 10 13 15 16 13 14 14 19 11 11 20 14 14 12 11 17 16 20 16 11 12
[23] 15 10 14 13 19 17 12 15
> data<-write.csv(a,'data.csv',row.names=F) #写文件
> newdata<-read.csv('data.csv') #读文件
> > unique(newdata) #删除重复项
x
1 19
2 10
3 13
4 15
5 16
7 14
10 11
12 20
15 12
17 17
2. 剔除数据结构中值为空(即缺失值以NA表示)的数据 na.omit (x)
> a<-5:15
> a[18]<-18
> a
[1] 5 6 7 8 9 10 11 12 13 14 15 NA NA NA NA NA NA 18
> na.omit(a)
[1] 5 6 7 8 9 10 11 12 13 14 15 18
attr(,"na.action")
[1] 12 13 14 15 16 17
attr(,"class")
[1] "omit"
3. 清除字符型数据前后的空格trim (x)
trim 函数来自 raster包,使用前,先使用 install.packages(“raster”) 安装,再使用 library (raster) 引入该包。
install.packages("raster")
library (raster)
> a<-' hello world '
> data<-trim(a)
> data
[1] "hello world" #字符串中间的空格不处理