DoRothEA实质上是tf-target gene的数据库,证据来源有实验文献、推测等,A (highest confidence) to E (lowest confidence) 。Regulon的概念是,某个TF调控的genes的集合。DoRothEA通常用VIPER这种统计方法.
DoRothEA既可以用于bulk也可以用于单细胞。
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("dorothea")
## We load the required packages
library(dorothea)
library(dplyr)
library(Seurat)
library(tibble)
library(pheatmap)
library(tidyr)
library(viper)
数据读入、质控、降维聚类注释完全按照seurat官方教程来。
输入格式可以是seurat object,dataframe, matrix。如果输入的是seurat object,结果将储存在assay data dorothea里。
- clustering cells with TF activity
## We read Dorothea Regulons for Human:
dorothea_regulon_human <- get(data("dorothea_hs", package = "dorothea"))
## We obtain the regulons based on interactions with confidence level