一、数据准备
10X单细胞转录组理论上有3个文件才能被读入R进行seurat分析,分别是barcodes.tsv 、 genes.tsv和matrix.mtx,文件barcodes.tsv 和 genes.tsv,就是表达矩阵的行名和列名
就会发现,matrix.mtx文件里面的33694、2049、1878957数值,分别是细胞数量,基因数量,以及有表达量的值的数量。
下游处理的时候,一定要保证这3个文件同时存在,而且在同一个文件夹下面,每一个样本都是3个文件,每一个样本都是同样的代码处理。
二、一般流程
(一)数据前处理:质控和数据过滤
1.基于QC度量的细胞选择与筛选(即质控)
2.数据标化与缩放(即数据标准化)
3.高度可变特征的检测(特征性基因的选择)
(二)PCA分析:线性降维
PCA分析,并且找到后续数据处理的维度
(三)细胞聚类
将具有相似基因表达模式的细胞之间绘制边缘,然后将他们划分为一个内联群体
并进行tSNE和UMAP分析
(五)差异分析&#x