- 摘要
- 继续使用sRNAnalyzer完成miRNA分析任务,今天要解决的是填充空白值和去除重复列的问题。由于生成的样品定量结果是在多个miRNA数据库中进行比对,因此生成的miRNA会重复出现,需要去重。同时,对于某些样品的reads没有比对到miRNA,并不是显示为0,而是直接为空白。之前一直是用excel手动处理。今天决定使用R一次性解决这个问题。简单在网上查了一下,几行代码就完成了这项工作。
- 环境配置
- R version 3.6.0
- 依赖包 tidyverse
- 使用代码
-
library(tidyverse) count <- read.table("smallrna.feature",header = T, sep = "\t",na.strings = "",check.names = F) #读取定量结果,sep能够进行分列,而na.strings可以将空白值用NA表示 count[is.na(count)] <- 0 #识别NA值,对所有的NA赋值0 count_dupli <- count[!duplicated(count$matchID),] #duplicated用于识别重复值,括号内为指定列,加上!为去重,方括号则是根据去重值删除整行
-