最近读入一个GWAS数据,数据很大,read.table()、Excel都打开失败了
fread()读入很快,但发现SNP列有很多空格
>a1<- fread("finngen_R9_O15_PREECLAMPS")
>a[8,5]
rsids
1: rs1201088959
>a[9,5]
rsids
1:
>is.na(a[9,5])
rsids
[1,] FALSE
最后到处搜寻发现fread和read.table一样有na.string的选项
>a1<- fread("finngen_R9_O15_PREECLAMPS",na.strings = c(""," ", NA),fill = TRUE,stringsAsFactors = FALSE)
>a1[9,5]
rsids
1: <NA>
最后把空白格转换成NA了