单细胞 | pySCENIC·转录因子分析(一)

SCENIC (Single-Cell rRegulatory Network Inference and Clustering)是一种能够从单细胞 RNA-seq 数据(SCENIC)或单细胞 RNA-seq+单细胞 ATAC-seq 的组合(SCENIC+, 今年新发的Nature Methods, 2023, 20, 1355–1367)中同时进行转录因子推断、基因调控网络重建的方法。

工作流程主要分为三个步骤:共表达网络推断、通过基因 motif 验证的调控网络模块(regulons)、regulons 活性计算。

pySCENIC中共表达推断方法GRNBoost2相比于R中GENIE3有很大的速度提升,所以建议前面的分析使用pySCENIC,后面可视化还是在R中进行(因为本人不怎么会python……)。

1. R中提取转置后的表达矩阵

mat <- as.matrix(sc@assays$RNA@counts)
#mat <- mat[rowSums(mat)>10,]
write.csv(t(mat),file="./counts.csv")

2.conda安装

conda create -n pyscenic python=3.7 #注意自己的python版本
conda activate pyscenic 
conda install -y numpy
conda install -y -c anaconda cytoolz
conda install -y scanpy
pip install pyscenic

3.制作一个trans.py,主要目的是把提取的表达矩阵转成loom文件,python trans.py运行

import os, sys
os.getcwd()
os.listdir(os.getcwd())
import loompy as lp;
import numpy as np;
import scanpy as sc;
x=sc.read_csv("counts.csv");
row_attrs={"Gene":np.array(x.var_names),};
col_attrs={"CellID":np.array(x.obs_names)};
%lp.create("sc.loom",x.X.transpose(),row_attrs,col_attrs);

4.准备好三个文件ranking database, motif database, TF list(注意物种),下载地址:

Welcome to the cisTarget resources website! (aertslab.org)

pySCENIC/resources at master · aertslab/pySCENIC (github.com)

5.三步搞定,最后得到sc_SCENIC.loom, reg.csv, adj.sc.tsv这三个文件就可以进行下一步可视化了

#推断转录因子与候选靶基因之间的共表达模块
pyscenic grn \
--num_workers 20 \
--output adj.sc.tsv \
--method grnboost2 \
sc.loom \
mm_mgi_tfs.txt

#DNA-motif分析选择TF潜在直接结合的靶点(regulon)
pyscenic ctx \
adj.sample.tsv /mm9-tss-centered-10kb-7species.mc9nr.genes_vs_motifs.rankings.feather \
--annotations_fname /mm10/cisTarget_database/motifs-v9-nr.mgi-m0.001-o0.0.tbl \
--expression_mtx_fname sc.loom \
--mode "dask_multiprocessing" \
--output reg.csv \
--num_workers 20 \
--mask_dropouts

#计算Regulons的活性
pyscenic aucell \
sc.loom \
reg.csv \
--output sc_SCENIC.loom \
--num_workers 8

参考:pySCENIC — pySCENIC latest documentation

SCENIC (aertslab.org)

  • 9
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CCA(canonical correlation analysis)是一种常用的多变量统计分析方法,可以用于整合分析单细胞转录组和空间转录组的数据。 单细胞转录组是指对单个细胞的转录组进行测量和分析,可以了解细胞间的异质性和功能特征。而空间转录组是指在组织或器官水平上,对转录组进行测量和分析,可以了解细胞在空间上的分布和相互作用。 在整合分析单细胞转录组和空间转录组时,首先需要对两种数据进行预处理,例如数据清洗、标准化和归一化等。然后,可以利用CCA方法来识别两种数据之间共享的信息和变化模式。 CCA通过最大化两个数据集之间的相关性,找到两者之间最大化的公共变量。具体步骤包括:首先,计算两个数据集之间的相关性矩阵;然后,利用Singular Value Decomposition(奇异值分解)将相关性矩阵分解成特征向量和特征值;最后,根据特征值的大小选择最相关的特征向量,得到两个数据集之间的相关性。 通过整合分析单细胞转录组和空间转录组的数据,可以获得以下优势:一是可以揭示细胞类型和组织结构之间的关系,帮助我们了解细胞的空间分布模式;二是可以发现特定细胞类型在不同组织中的表达模式和功能特征;三是可以识别具有生物学意义的共同变化模式,为进一步研究和解读提供线索。 当然,整合分析单细胞转录组和空间转录组的数据还需要结合其他的统计方法和生物学解释来进行综合分析和解读。这样的整合方法可以为我们更好地理解细胞和组织的功能和相互作用提供重要的信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值