读取TCGA上的tsv文件,以及查看疾病病理类型
1.readr包
> library(readr) #调用readr包
> read_tsv("pcawg.tsv") #读取名为pcawg.tsv的文件
注意:文件要放在工作目录下
工作目录查询
> getwd()
[1] "C:/Users/Yu/Documents/R"
改变工作目录
> setwd("C:/Users/Yu/Documents/R")
注意:双引号和分隔符方向"/"
2.read.table函数
mydata<-read.table("pcawg.tsv",sep="",fill = T) #fill是为了把空值填充,以免报错,但是sep把数据分隔错了,还不知道怎么解决这个问题。well
如图
查看文件长度length=4,将tumour_histological_type赋值给histype,再做分类的分析
分类分析,使用table()函数
>fre<-table(histype) #分类
> fre
转换为数据框data.frame
> fre2<-data.frame(fre)
> fre2
查看数据框的长宽
> dim(fre2)
[1] 78 2
> length(fre2)
[1] 2