欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/131423024
DEDAL:Deep Embedding and Differentiable ALignment
这篇论文提出一种新的蛋白质序列比对算法,叫做 DEDAL (深度嵌入和可微分对齐)。利用最新的深度学习语言模型和可微分编程的技术,学习一个能够根据输入序列自适应地生成替换得分和缺口惩罚的模型。在大量的原始蛋白质序列和已知正确对齐的序列对上进行训练,然后用标准的 Smith–Waterman (史密斯-沃特曼) 算法来寻找最优的局部对齐。实验结果表明,DEDAL在远缘同源序列上的对齐准确度,和同源检测能力都显著优于现有的方法,尤其是在低序列相似度的情况下。
这篇论文的创新点主要有以下几个方面:
- 提出了一种灵活的参数化方法,使得替换得分和缺口惩罚能够根据每对序列和每对位置的上下文信息进行调整,而不是使用固定的矩阵和参数。
- 使用了一个基于 Transformer 的深度语言模型,将离散的蛋白质序列映射到一个连续的向量空间,从而能够捕捉序列之间的复杂相似性。
- 设计了一个可微分的 Smith–Waterman 算法&