蛋白质设计基础概念
RMSD
RMSD一般是用于衡量的某个时刻相对于参考构象的结构偏差。
而RMSF是一段时间内,某一个原子相对于参考构象的结构变化的程度,反应了原子的自由度。
TM Score
TM-Score 是一个评价蛋白质结构拓扑相似性的指标。它旨在解决均方根偏差(RMSD)等传统指标中的两个主要问题:
- TM-score对较小的距离误差的权重大于较大的距离误差,并使分数值对全局折叠相似性比对局部结构变异更敏感;
- TM-score引入了长度依赖性量表来归一化距离误差,并使随机结构对的TM分数的大小与长度无关。
TM 分数的值为 0~1,其中 1 表示两个结构之间的完美匹配。根据对 PDB 结构的严格统计,低于 0.17 的分数对应于两个随机的不相关蛋白质,而分数高于 0.5 的结构则表示两个蛋白质结构的大致相同。
PIDDT
pLDDT分数是AlphaFold2用来评估结构预测质量的置信系数,pLDDT≥0.7表示预测的结构可能正确,pLDDT<0.7表示预测的结构可能错误。在RFdiffusion模型设计蛋白质的过程使用pLDDT>0.8作为筛选指标
sequence recovery
序列恢复是通过读取两组结构,然后通过遍历所有残基来计算它们之间的百分比一致性来测量的。
global score
样本/固定氨基酸在所有链中的所有残基的平均负对数概率。