AAC(氨基酸组成)
氨基酸组成(AAC)编码计算蛋白质或肽序列中每种氨基酸类型的频率。所有20种天然氨基酸(即“ACDEFGHIKLMNPQRSTVWY”)的频率可以计算为:
其中N(t)是t型氨基酸的数量,而N是蛋白质或肽序列的长度。AAC描述符已成功应用于核受体分类和抗癌肽预测。
CKSAAP (k-间隔氨基酸对的组成)
CKSAAP特征编码计算任意k个残基(k= 0,1,2,…,5)分隔的氨基酸对的频率。以k=0为例,有400个0间隔的残基对(即AA、AC、AD、…、YY.)。那么,一个特征向量可以定义为: