Resistify是一个用于快速且准确地注释植物中的NLRs(Nucleotide-binding domain Leucine-rich Repeat,核苷酸结合域富含亮氨酸重复序列)并提供准确结构分类的工具。NLRs是植物先天免疫系统的关键组成部分,具有显著的存在/缺失变异和序列多样性。Resistify的开发旨在克服现有NLR预测工具在准确性、速度和可用性方面的限制。

Resistify:快速鉴定植物NLR基因_生物信息

Github

 https://github.com/SwiftSeal/resistify

使用:

# install
conda install -c bioconda resistify  #pip install resistify

# usage
resistify <input.fa> <output_directory>
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.

结果目录:

results.tsv - 包含 Resistify 主要结果的表。

motifs.tsv - 为每个序列标识的所有 NLR 基序的表格。

domains.tsv - 为每个序列标识的所有域的表。

nbarc.fasta - 识别的所有 NB-ARC 域的 fasta 文件。
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.

论文里总结了目前用于注释NLRs基因的流程:

Resistify:快速鉴定植物NLR基因_ci_02

以下是文章的主要内容总结:

  1. 背景:NLRs在植物基因组中具有高度的多样性,并且与病原体因子的检测和免疫反应的引发密切相关。NLRs的准确识别对于理解它们的功能和识别潜在的抗病性来源至关重要。
  2. Resistify工具:这是一个基于Python的命令行工具,使用定制的HMMs(隐马尔可夫模型)来识别NLRs的不同结构域,包括CC、RPW8、TIR、NB-ARC、C-JID和MADA等。Resistify能够合并重叠或接近的相同类型结构域,并且可以正确地对NLRs进行分类。
  3. 性能评估:通过与RefPlantNLR数据库的比较,Resistify显示出高度的灵敏度和准确性,尤其是在分类具有挑战性的CNL亚家族方面。此外,它还能够在Araport11蛋白质组中识别和分类NLRs,并且成功地检索NB-ARC结构域注释,用于系统发育分析。
  4. 应用实例:文章展示了Resistify在Solanum泛基因组中的使用,其中包括了对18个连续Solanum基因组的处理,预测基因、识别同源基因,并使用Resistify对NLRs进行分类。
  5. 发现:在Solanaceae基因组中,NLRs与Helitron转座元件之间存在以前未描述的关联。此外,Resistify未能复制之前观察到的LTR(长末端重复序列)与NLRs在Solanaceae中的广泛关联,这可能与基因和TE注释以及NLR分类的差异有关。
  6. 结论:Resistify是一个高效、易于使用的工具,适用于识别新的抗性基因,并且可以轻松集成到工作流程中,适用于大规模的泛基因组实验。

文章还包含了对Resistify性能的详细评估,以及它在植物基因组研究中的潜在应用。

作者:生物信息与育种,若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。