RSTUDIO整理数据后tsv文件首行是NA

新手小白求助大神,从TCGA中下载的数据整理,期间无报错,但是最后跑出来的tsv文件首行是NA,样本编号不显示。重新下载数据Metadata和counts文件再进行处理仍然是NA,同学用同样的代码整理出的文件正常 

以下是代码,以下两张图片是同学和我过程中出现JSON文件的不同之处,有无大神可以看看是哪里出了问题吗,谢谢


setwd("C:/Users/Lenovo/Desktop/good")  

library("rjson")
json <- jsonlite::fromJSON("metadate.json")   
View(json)

sample_id <- sapply(json$associated_entities,function(x){x[,1]})
file_sample <- data.frame(sample_id,file_name=json$file_name)  

count_file <- list.files('gdc_download_20240920_024203.770910',pattern = '*.tsv',recursive = TRUE)  
count_file_name <- strsplit(count_file,split='/')
count_file_name <- sapply(count_file_name,function(x){x[2]})


matrix = data.frame(matrix(nrow=60660,ncol=0))


for (i in 1:554){
  path = paste0('gdc_download_20240920_024203.770910//',count_file[i])   #Counts文件夹名
  data<- read.delim(path,fill = TRUE,header = FALSE,row.names = 1)
  colnames(data)<-data[2,]
  data <-data[-c(1:6),]
  data <- data[3]   #数据类型,选择其中之一 3:unstranded;4:stranded_first;5:stranded_second;6:tpm_unstranded;7:fpkm_unstranded;8:fpkm_uq_unstranded
  colnames(data) <- file_sample$sample_id[which(file_sample$file_name==count_file_name[i])]
  matrix <- cbind(matrix,data)
}

write.csv(matrix,'GBM Counts_matrix.csv',row.names = TRUE)

尝试解决,把代码里的的associated_entities换成json里的entity_submitter_id,出现报错,最后出现的文件里仍然是NA

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值