1. 首先根据scRNA-seq找到细胞类群的marker 基因;比如下面三大类群细胞(虚线圈起来的);
比如:Myeloid cell: 20 个marker 基因。
2. 根据scATAC-seq 计算细胞之间的相似度;按照peak 开放性;
tSNE图,先根据开放性peak,对所有细胞进行聚类分析;然后随机挑取一个细胞(Myeloid,Maker 基因promoter开放),根据开放性,计算其他所有细胞和这个细胞的相似性,并在图中用 "point" 大小表明。紧接着保留相似性最高的n个细胞,用下图的线衡量他们之间关联;假设cellA 和 cellB 、cellC 关联.
3. 对于scATAC-seq里面的cellA, 假设计算与Myeloid cell 的influence score;
influence score= M(cell A)/N; 当score 大于一定值得时候,ATAC-seq里面的cellA ,就可以被推断是不是Myeloid cell.
M 指的是:在cellA里面, 落在promoter of Myeloid cell marker genes的ATAC-seq peaks
N 指的是: 在cellA里面 total ATAC-seq peaks。
4. 由于cellB 和cellC里面ATAC-seq peak由于数据稀疏问题,没有办法检测在Myeloid cell marker genes的ATAC-seq信息。但是根据 scATAC-seq里面:cellA 和 cellB 、cellC 关联. 因此也可以推断cellB cellC 也是Myeloid cell;这个可以被认为是diffuse influence.
ref:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-021-02279-1