n'n'n
原始数据和目标数据如图所示。要达到目标格式,需要以下步骤:设原始数据为df,整理数据为a
1:去除不需要的行和列,第一行,第二行和第四行,第二列
df <- df[-(1:2),]
df <- df[-2,]
df <-df[,-2]
2:第一列作为行名,第一行作为列名
colnames(df) <- df[1,]
df <- df[-1,]
rownames(df) <- df$`Cell line cosmic identifiers`
注意不能直接使用rownames(df) <- df[,1],因为tibble上设置行名已经不推荐使用了。并且不能直接删除df的第一列,否则新设置的行名和第一列都会被删除。
3:对列名进行操作。加上“COSMIC_”,然后删掉df的第一行即可。
df <- df%>%t()%>%as.data.frame
colnames(df) <- paste0("COSMIC_",colnames(df))
df <- df[-1,]
paste0函数用来连接字符串。
paste0和paste的区别如下:
paste()
函数需要使用sep
参数指定字符向量之间的分隔符,默认分隔符是一个空格。例如,paste("a", "b", "c", sep = "-")
返回的是字符串"a-b-c"
。paste0()
函数是paste()
函数的简写,它默认的分隔符是空字符,即没有分隔符。例如,paste0("a", "b", "c")
返回的是字符串"abc"
。