PSSM 文件
PSI-BLAST 输出的 PSSM 文件通常包含两个主要部分:位置特异性打分矩阵(PSSM) 和 观测频率矩阵。PSSM 文件记录了查询序列中每个位置的打分、氨基酸频率、信息含量等,用于描述保守性模式。
之前的文章PSI-BLAST生成的PSSM文件转换为pssm_dict字典-CSDN博客对PSI-BLAST生成的PSSM文件格式解析有点错误 : 第 22-41 列应该为不同氨基酸的观测频率矩阵。
(1) PSSM 打分矩阵部分
-
位置编号:代表查询序列中该氨基酸的位置。
-
氨基酸:表示该位置上的氨基酸。
-
20 列打分:针对该位置的 20 种氨基酸的 log-odds scores。这个得分是根据查询序列和同源序列中的观测频率与背景频率的比值计算的,表示每个氨基酸相对于背景频率的富集情况。