PySCENIC(二):pyscenic单细胞转录组转录因子分析

我们继续完成pySCENIC的分析!本来想这一节可视化也讲了,但是不着急,我发现有些伙伴没搞明白原由,或者太会“衣来伸手饭来张口”,所以这里着重整理了需要下载的文件!!!

上一节说了pySCENIC的分析环境配置及安装,除了这些,还有一些必要条件,例如相关文件的下载,一些数据转化等等。

为了减轻大家的负担,文件我已经下载好了,包括人的、鼠的,以及转化文件的py脚本,已上传QQ群文件,群成员可在群里免费获取!

假设你完成了上面的步骤,那接下来的分析至少在代码上很简单,三个步骤,可能会等待一段时间,尤其是第一、二步骤,不过相比于R简直是神速。注意:建议还是用服务器(别开玩笑用免费的2G内存的服务器😂),除非你的数据不大可用≥64G内存的本机。

分析第一步:GRN---运行完得到sce.adj.csv文件

pyscenic grn --num_workers 10 \
  --sparse \
  --method grnboost2 \
  --output sce.adj.csv \
  sce.loom \
  hs_hgnc_tfs.txt
  #这一步的目的
  #推断转录因子与提供的表达矩阵基因的共表达模块,基于grnboost2,R中时GENIE3

参考基因组的情况根据实际情况自行下载,当然我下载的也可以用,具体深入的原理有兴趣的可以去了解,我只是参考文献使用的!数据库更新了,用之前的文件会出错!

鼠的下载地址:

Index of /cistarget/databases/mus_musculus/mm10/refseq_r80

人的下载地址:

Index of /cistarget/databases/homo_sapiens/hg38/refseq_r80
分析第二步:RcisTarget---运行完得到sce.regulons.csv文件

pyscenic ctx --num_workers 10 \
  --output sce.regulons.csv \
  --expression_mtx_fname sce.loom \
  --all_modules \
  --mask_dropouts \
  --mode "dask_multiprocessing" \
  --min_genes 10 \
  --annotations_fname motifs-v9-nr.hgnc-m0.001-o0.0.tbl \
  sce.adj.csv \
  hg38__refseq-r80__10kb_up_and_down_tss.mc9nr.genes_vs_motifs.rankings.feather
  #这一步的目的
  #进行TF-motif富集分析,识别直接靶标
  #得到转录因子(TF)与其对应的直接作用的靶点,称为regulon(每一个regulon是1个TF和其调控的靶基因)

分析第三步:AUCell---运行完得到sce_SCENIC.loom文件,即分析结果

pyscenic aucell --num_workers 3 \
  --output sce_SCENIC.loom \
  sce.loom \
  sce.regulons.csv
  #这一步的目的
  #使用AUCell对每个细胞的每个regulon活性进行评分。

以上就是pyscenic的分析内容了!

更多精彩内容请至我的公众号---KS科研分享与服务

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
CCA(canonical correlation analysis)是一种常用的多变量统计分析方法,可以用于整合分析单细胞转录和空间转录的数据。 单细胞转录是指对单个细胞的转录进行测量和分析,可以了解细胞间的异质性和功能特征。而空间转录是指在织或器官水平上,对转录进行测量和分析,可以了解细胞在空间上的分布和相互作用。 在整合分析单细胞转录和空间转录时,首先需要对两种数据进行预处理,例如数据清洗、标准化和归一化等。然后,可以利用CCA方法来识别两种数据之间共享的信息和变化模式。 CCA通过最大化两个数据集之间的相关性,找到两者之间最大化的公共变量。具体步骤包括:首先,计算两个数据集之间的相关性矩阵;然后,利用Singular Value Decomposition(奇异值分解)将相关性矩阵分解成特征向量和特征值;最后,根据特征值的大小选择最相关的特征向量,得到两个数据集之间的相关性。 通过整合分析单细胞转录和空间转录的数据,可以获得以下优势:一是可以揭示细胞类型和织结构之间的关系,帮助我们了解细胞的空间分布模式;是可以发现特定细胞类型在不同织中的表达模式和功能特征;三是可以识别具有生物学意义的共同变化模式,为进一步研究和解读提供线索。 当然,整合分析单细胞转录和空间转录的数据还需要结合其他的统计方法和生物学解释来进行综合分析和解读。这样的整合方法可以为我们更好地理解细胞和织的功能和相互作用提供重要的信息。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值