加载数据
能够同时检测来自同一细胞的多种数据类型,称为多模式分析,代表了单细胞基因组学的一个新的和令人兴奋的前沿。例如CITE-seq能够同时检测来自同一细胞的转录组和细胞表面蛋白质。其他令人兴奋的技术,如[10 XGenomics],允许对 scRNA-seq和scATAC-seq进行配对检测。Seurat 4.0,可以无缝存储、分析和探索多样化的多模式细胞数据集。
在这里,我们分析8,617个脐带血单核细胞(CBMCs)的数据集,其中转录组与11种表面蛋白质的丰度配对,对这些蛋白质的水平与DNA进行量化。首先,我们加载两个计数矩阵:一个用于RNA测量,另一个用于抗体衍生标签(ADT)。您可以在此处下载ADT文件[1]和RNA文件[2]
library(Seurat)
library(ggplot2)
library(patchwork)
# Load in the RNA UMI matrix
# Note that this dataset also contains ~5% of mouse cells, which we can use as negative controls
# for the protein measurements. For this reason, the gene expression matrix has HUMAN_ or MOUSE_
# appended to the beginning of each gene.
cbmc.rna <- as.sparse(read.csv(file = "../data/GSE100866_CBMC_8K_13AB_10X-RNA_umi.csv.gz", sep = ",",
header = TRUE, row.names = 1))
# To make life a