单细胞选取数据

最新推荐文章于 2024-06-05 11:20:31 发布

yangkfor

最新推荐文章于 2024-06-05 11:20:31 发布

阅读量2.1k

点赞数

分类专栏： R 文章标签：机器学习深度学习 r语言单细胞

本文链接：https://blog.csdn.net/qq_42119386/article/details/125334814

版权

8 篇文章 0 订阅

订阅专栏

默认情况下，我们是对Seurat中的RNA的Assay进行操作。最初开始的数据只有一个RNA的assay，数据在进行变换SCT，或者整合单样本数据intergration，或去除污染SoupX，或融合velocity；都会将处理后的结果数据存放到新的Assay中。

可以通过@active.assay查看当前默认的assay，通过DefaultAssay()更改当前的默认assay。

counts为raw原始数据，我们开始对assay中的RNA数据中的counts进行处理，对稀疏矩阵进行归一化处理后的结果存储在data，接着用ScaleData()处理后的数据存储在scale.data中。
在这里插入图片描述

三种数据之间的结构

counts：存储原始数据，是稀疏矩阵
data：存储logNormalize() 规范化的data。总表达式对每个单元格的要素表达式度量进行标准化，将其乘以比例因子（默认为10,000），并对结果进行对数转换
scale.data：存储 ScaleData()缩放后的data，此步骤需要时间久。

每个数据都是一个单独的数据框，列名都是一样的，但是存放的数据不一样。

调用方法： head(pbmc@assays$RNA@data) ：调用raw数据

元数据，对每个细胞的描述。一般的meta.data包括orig.ident, nCount_RNA, nFeature_RNA, 以及计算后的percent.mt，RNA_snn_res.0.5等；后期的线粒体过滤、细胞个数是通过该表进行操作的。

调用方式：pbmc$percent.mt或pbmc[['percent.mt']]：查看percent.mt比例，一个是data.frame;一个是向量。

降维后的每个细胞的坐标信息，包括pca，tsne，umap等；将integrated作为默认assay进行PCAUMAP等分析。

教程中，pbmc[[‘percent.MT’]]向meta.data添加 percent.MT 这一列。
pbmc[[]]，中括号取的是上面结构图中的二级数据名称

@, $符号依次取，是两个符号交替进行，先 @ 在$ ，如pbmc@assays$RNA@data；此处没有$之后接向量的含义，跟R选取数据不同。

针对assay或者resolution而言，两种方式得到的结果不存在差别

pbmc[['RNA']] 或者 pbmc@assays$RNA
pbmc[['pca']] 或者pbmc@reductions$pca

针对meta.data的分析内容存在差别

pbmc[['nCount_RNA']] #取出来是所有细胞的nCount_RNA，是一个数据框
pbmc@meta.data$nCount_RNA #取出来的是单独nCount_RNA一列，是向量

关注

专栏目录