与传统的转录组测序相比,单细胞测序技术噪声很大,使得单细胞转录组数据包含大量的dropout事件(导致基因表达量为0或接近0),即使是一些标记(Marker)基因也有可能表达量很低。当在使用其对聚类的细胞类型进行注释的时候,往往会影响可视化效果。
Nebulosa是一个基于加权核密度估计新出的R包,用于可视化单细胞的数据。它的目的是通过纳入细胞之间的相似性,允许细胞特征的 “卷积”,来恢复丢失的基因信号。
数据准备
首先需要安装和加载相应的包:
if (!requireNamespace(“BiocManager”, quietly = TRUE))
install.packages(“BiocManager”)
BiocManager::install(“Nebulosa”)
library(“Nebulosa”)
library(“Seurat”)
测试数据选择10x Genomics 免费提供的外周血单核细胞(PBMC)数据集,约有2700个细胞(https://cf.10xgenomics.com/samples/cell/pbmc3k/pbmc3k_filtered_gene_bc_matrices.tar.gz),下载完解压获得单细胞表达矩阵文件夹。接下来就简单的导入数据对其进行质控啦。
data <- Read10X(data.dir = “filtered_gene_bc_matrices/hg19/”)
pbmc <- CreateSeuratObject(counts = data,project = “pbmc3k”,min.cells = 3,min.features = 200)
pbmc[[“percent.mt”]] <- PercentageFeature