Souporcell 开源项目教程
souporcellClustering scRNAseq by genotypes项目地址:https://gitcode.com/gh_mirrors/so/souporcell
1、项目介绍
Souporcell 是一个用于混合基因型单细胞RNA测序实验的聚类方法。它不需要事先知道单个细胞的SNP基因型,能够有效地对混合样本进行解复用。Souporcell 主要由六个步骤组成,包括重新映射(使用 minimap2)、候选变异位点调用(使用 freebayes)、细胞等位基因计数(使用 vartrix)、通过基因型对细胞进行聚类(使用 souporcell.py)、双细胞调用(使用 troublet)以及调用聚类基因型和推断环境RNA的量(使用 consensus.py)。
2、项目快速启动
安装 Souporcell
首先,克隆 Souporcell 仓库到本地:
git clone https://github.com/wheaton5/souporcell.git
将 Souporcell 目录添加到你的 PATH 中。你需要确保以下工具在你的 PATH 中:samtools、bcftools、htslib、python3、freebayes、vartrix 和 minimap2。推荐使用 conda 环境进行安装:
conda env create -f /path/to/souporcell/souporcell_env.yaml
conda activate souporcell
还需要安装 Rust 并编译两个 Rust 二进制文件:
curl --proto '=https' --tlsv1.2 -sSf https://sh.rustup.rs | sh
cd /path/to/souporcell/souporcell && cargo build --release
cd /path/to/souporcell/troublet && cargo build --release
运行 Souporcell
假设你已经准备好了输入文件(如 possorted_genome_bam.bam
和 barcodes.tsv
),你可以运行 Souporcell:
souporcell -a alt_matrix.mtx -b barcodes.tsv -n num_clusters -r ref_matrix.mtx
3、应用案例和最佳实践
应用案例
Souporcell 可以用于分析来自多个捐赠者的混合样本,特别是在没有 SNP 基因型信息的情况下。例如,在研究癌症细胞的异质性时,可以使用 Souporcell 来区分来自不同捐赠者的细胞。
最佳实践
- 数据准备:确保输入的 BAM 文件和 barcodes 文件是正确的,并且与 CellRanger 的输出格式一致。
- 参数调整:根据实验的具体情况调整
num_clusters
参数,以匹配实际的捐赠者数量。 - 结果验证:使用其他软件(如 Vireo)的结果来验证 Souporcell 的聚类结果。
4、典型生态项目
Souporcell 可以与其他单细胞分析工具结合使用,形成一个完整的分析流程。例如:
- CellRanger:用于初始的单细胞测序数据处理。
- Seurat:用于单细胞数据的进一步分析和可视化。
- Vireo:用于验证 Souporcell 的聚类结果。
通过这些工具的结合使用,可以实现从原始测序数据到最终生物学结论的完整分析流程。
souporcellClustering scRNAseq by genotypes项目地址:https://gitcode.com/gh_mirrors/so/souporcell