Foldseek在线蛋白质结构搜索

Foldseek 是由韩国首尔大学 Martin Steinegger 团队开发的蛋白质结构相似性搜索工具,其核心技术基于 3Di(三维相互作用字母表) 和 MMseqs2 框架,实现了速度与灵敏度的突破。以下是其关键特性:

  1. 快速结构比对
    Foldseek 将蛋白质结构离散化为 20 种 3Di 状态字母表,结合序列和结构信息进行比对,速度比传统工具(如 Dali、TM-align)快 4-5 个数量级。例如,在单张 GPU 上,搜索 100 万个结构仅需数秒,而传统方法需数小时至数天。
  2. 低序列相似性识别
    即使序列同一性低于 15%,Foldseek 仍能通过结构相似性检测同源蛋白。例如,在黄病毒科研究中,它成功识别了序列同源性仅 10-15% 的庚肝病毒与瘟病毒 E1 糖蛋白的结构同源性。
  3. 多场景支持
    • 数据库搜索:支持 AlphaFoldDB、PDB、CATH 等 7 大数据库,覆盖超 6 亿个结构(截至 2025 年)。
    • 复合物比对:2025 年推出的 Foldseek-Multimer 模块可快速比对蛋白质复合物,速度比 US-align 快 100 倍以上,适用于宏基因组数据分析和药物靶点筛选。
    • 聚类与注释:通过结构聚类(如 easy-cluster 模块)生成代表性序列,辅助功能注释和进化分析。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值