NanoConsensus:从直接 RNA 纳米孔测序数据中预测 RNA 修饰的共识预测
NanoConsensus 是一种软件,能够从直接 RNA 测序数据集中稳健地识别潜在的 RNA 修饰位点。
目录
- 一般描述
- 安装
- 运行代码
- 预期输出
- 引用
- 联系
一般描述
NanoConsensus 使用四种不同的 RNA 修饰检测软件(Epinano、Nanopolish、Tombo 和 Nanocompore)在每个转录本水平上进行成对比较(例如 WT 与 KO)。然后,它将生成的所有结果结合起来,产生一个共识预测,这比单个软件的结果更稳健。
NanoConsensus 执行以下步骤:
-
运行 RNA 修饰检测软件。NanoConsensus 的第一步是运行四种不同的 RNA 修饰检测算法(EpiNano、Tombo、Nanopolish 和 Nanocompore),以成对方式进行(即比较 WT/对照/条件1 与 IVT/Knockout/条件2 样本)。这一步以 Nextflow 管道的形式实现,并已嵌入 Master of Pores,以更新的 NanoMod 模块的形式。这些算法将为每个单独位置在每个转录本水平上产生分数(p 值、差异误差或差异电流强度)。
-
每个转录本的 Z 分数标准化。然后,NanoConsensus 对每个数据集和方法(EpiNano、Tombo、Nanopolish 和 Nanocompare)进行 Z 分数标准化,以每个转录本的方式进行。然后使用 Z 分数选择每个独立软件的候选 RNA 修饰位置,这些位置必须高于用户提供的默认阈值(默认值 = 5)。
-
灵活重叠。在接下来的步骤中,第二步中识别的每个独立软件的候选位置扩展到 5-mers。然后执行灵活重叠,以识别跨软件的重叠 k-mers。由两个或更多软件支持的区域然后被保存为潜在的修饰位点。
-
Z 分数的重新缩放。Z 分数值受转录本覆盖率的影响。因此,为了使最终合并的结果在转录本之间可比,NanoConsensus 将 Z 分数值重新缩放至 0 和 1 之间。然后,它计算 NanoConsensus 分数,该分数等于所有软件重新缩放的 Z 分数的中位数。这在确定的转录本的所有位置上执行。
-
过滤潜在的修饰位点。从所有先前识别的潜在修饰位点检索 NanoConsensus 分数,并与特定阈值进行比较。此阈值由整个转录本的 NanoConsensus 分数的中位数乘以一个整数确定,5 为默认值。那些 NanoConsensus 分数高于阈值的潜在修饰位点然后被报告,而所有未验证的结果被丢弃。
安装
如果需要,从其 GitHub 存储库安装 Master of Pores:
git clone https://github.com/biocorecrg/master_of_pores_dev.git
然后,从其 GitHub 存储库安装 NanoConsensus:
git clone https://github.com/ADelgadoT/NanoConsensus.git
运行代码
首先,用户应使用 Master of Pores 管道的 NanoPreprocess 模块对直接 RNA 测序数据集进行基础调用和映射。要运行此模块,请填写 params.config 文件所需的信息,然后使用以下命令。如果需要更多信息,请点击这里。
nextflow run nanopreprocess.nf -with-singularity -bg > log.txt
下一步是使用 Master of Pores 管道的 NanoMod 模块,以成对方式运行四种不同的 RNA 修饰检测算法(EpiNano(v1.1)、Tombo(v1.5)、Nanopolish(v0.11.1) 和 Nanocompore(v1.0.0))。填写 params.config 和 comparison.tsv 文件,然后使用以下命令。如果需要更多信息,请点击这里。
nextflow run nanomod.nf -with-singularity -bg > log.txt
最后,要执行 NanoConsensus 分析,除了 NanoMod 生成的文件外,用户必须提供以下输入:
- 参考文件(.fa)(查看完整输入)
- 转录本名称 - 应与参考文件中的 fasta ID 匹配 - 例如:18S
- 起始位置 - 必须是整数 - 例如:50
- 结束位置 - 必须是整数 - 例如:1492
这些由 NanoMod 生成的输入也需用于分析:
- Epinano 输出:WT 和