MiMB_JACUSA2_chapter
JACUSA2 - 一个用于 RNA 修饰映射的框架
我们提供了一个使用纳米孔直接 RNA-seq 检测 RNA 修饰的 Snakemake 管道,适用于多种条件和重复样本。
一般描述
该管道基于 JACUSA2 变体调用,JACUSA2 的输出被分析以检测 RNA 修饰模式并预测修饰位点。
JACUSA2 基于映射特征检测修饰,它需要 BAM 文件作为输入。
JACUSA2 可以以单模式(调用-1)或配对模式(调用-2)运行。为了提高灵敏度,我们采用配对模式。
我们手稿中使用的所有数据都可以在 Zenodo 上找到。
安装
我们建议通过 Linux 上的 Conda 安装软件依赖。你可以在这里找到 Linux 的 Miniconda 安装说明。
确保你安装了 Miniconda Python3 分发版。
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
在 Conda 安装程序中,你需要接受许可证并选择一个安装目录。当被询问时,也选择运行 ‘conda init’。安装程序完成后,你可以打开一个 shell 来获取基本的 Conda 设置。
出于性能和兼容性原因,你应该通过 conda 安装 Mamba 以安装 Snakemake。更多详细信息请参阅 Snakemake 文档。
conda install -c conda-forge mamba
安装了 Conda 和 Mamba 后,你可以下载 Snakemake 管道。
git clone https://github.com/dieterich-lab/MiMB_JACUSA2_chapter.git
cd MiMB_JACUSA2_chapter/Nanopore_HEK293
然后,在创建环境后,使用下载的 environment.yml 文件安装所需的包。
mamba env create -f environment.yaml
conda activate JACUSA2pipeline_env
在执行 Snakemake 工作流之前,我们建议下载 JACUSA2 jar 文件,并确保你在配置文件中设置了 jar 文件的路径。如果没有设置 jar 文件,将会自动下载并使用 “JACUSA_v2.0.1.jar”。
使用方法
以下协议描述了如何从纳米孔直接 RNA-seq 数据中检测 m6A 修饰。基准测试来自 PRJEB40872,由两个条件的两个样本组成:野生型细胞(WT,修饰 RNA)和 Mettl3 敲除细胞(KO,未修饰 RNA),每个条件有两个重复(2 和 3)。监督分析(模式学习)和评估基于 miCLIP_union.bed 文件中的 m6A 位点。这些位点在三个基于 miCLIP 的研究中报告:Bouliaset al. [2019], Koh et al. [2019], Körtel et al. [2021]。三个研究的共识注释为 “Boulias,Koertel,Koh” 用于训练过程,而测试集涉及其余的 miCLIP 位点和非 miCLIP 位点。[按照手稿的使用案例 1,我们将分析限制在 ‘data/selected_regions.bed’ 文件中报告的位点集,该文件指的是使用案例 1 和 2 的样本交集]
我们在此介绍生成 BAM 文件的主要步骤,这些文件将是我们管道的输入。
直接 RNAseq 的预处理
使用 Guppy basecaller 对存储在 FAST5 文件中的离子电流信号进行基础呼叫。
guppy_basecaller --compress_fastq -i path_to_fast5 -s path_to_output -c config_file.cfg