微生物 OTU ASV Feature table过滤2 基于qiime2的bar plot导出的

最新推荐文章于 2023-07-26 17:04:45 发布

还没想好123

最新推荐文章于 2023-07-26 17:04:45 发布

阅读量1.1k

点赞数

文章标签： r语言

本文链接：https://blog.csdn.net/weixin_46623488/article/details/121736015

版权

#导入的是直接bar导出的csv【有group变量】
originaldata=read.csv("level-6.csv.csv",row.names = 1,header=F)
dim(originaldata)
data1=originaldata
ncol(data1) 
data1 <- data1[,-114]  #去掉最后一列分组的
ncol(data1)
data2 <- as.data.frame(t(data1))
library(tidyverse)
data3 <- rownames_to_column(data2,var='id')
nrow(data3)
taxonomy <- data3[1:113,1:2]
#检查下
table(taxonomy$id == rownames(data2))

#用来过滤的数据是
#去掉第一行
data <- data1[-1,]

data[1:3,1:3] #此时的{行=样本} 列为OTU

#转化为数值
dim(data)  #
str(data[1:3]) #需要转化成数值
data[,1:113]<-lapply(data[,1:113],as.numeric)
#ASVs with fewer than 10 reads were removed.
data[data < 10] <- 0

#过滤方法1
library(Hmisc)

#相对丰度转化

A=data  #行=样本
C=A/rowSums(A)
genus=t(C)

#可选事先过滤一些低丰度或低频的类群，行=OTU
#例如只保留相对丰度总和高于 0.02% 的属
genus <- genus[which(rowSums(genus) >= 0.0002), ] 

genus1 <- genus
#大于0的赋值为1
genus1[genus1>0] <- 1
#上一步大于0变成1后，下一步合算1多少个，保留下来 259*20%=51.8
genus <- genus[which(rowSums(genus1) >=52 ), ]  
#例如只保留在 52个及以上样本中出现的属


#合并Taxonomy
genus <- as.data.frame(genus)
genus2 <- rownames_to_column(genus,var='no')

final <- left_join(genus2,taxonomy,
                    by=c('no'='id'))  #向data1的names1有的合并(全部变量)
final <- select(final,index,everything())
final <- select(final,-no)
final[1:2,1:2]
#导出数据
write.csv(final,"L6_filter_0.0002.csv",row.names =FALSE )

还没想好123

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
微生物 OTU ASV Feature table过滤2 基于qiime2的bar plot导出的

#导入的是直接bar导出的csv【有group变量】originaldata=read.csv("level-6.csv.csv",row.names = 1,header=F)dim(originaldata)data1=originaldatancol(data1) data1 <- data1[,-114] #去掉最后一列分组的ncol(data1)data2 <- as.data.frame(t(data1))library(tidyverse)data3 <-
复制链接

扫一扫