π值的计算
- 将之前比好的序列并保存为.mas格式的文件拖拽到MEGA里,选择analysis。
-
计算Π值,需要使用CDS序列,选择yes。
-
选择DISTANCE -> Compute Pairwise Distances
将参数设置为上图所示,选择JC校正模型。
即可得到上图所示的结果,每个单元格中的值即为π值,该值介于0~1之间,该值越趋近于0,代表着该单元格对应的两条序列之间的核苷酸差异越小。
若单元格中的值超过1,说明该单元格对应的两条序列的核苷酸差异已经大于它们自身的长度了。若出现上图所示的标红的n/c的情况,代表着两条序列的差异过大,不能利用π值来反应差异情况了。
Ka/Ks的计算
-
与计算π值的前两步相同,将比对好的CDS序列导进MEGA,选择analysis。
-
选择DISTANCE-> Compute Pairwise Distances
参数设置参考上图,密码子表根据自己序列的实际情况来选择,在这里我选择的是Standard,标准密码子表。Substitutions to Include,先选择s:Synonymous only(同义替换),再选择n:Nonsynonymous only(非同义替换)。
得到的结果为上图所示的n*n的矩阵(n为序列的个数),选择上方excel按钮,导出到一个excel表格中。
参数默认即可。
在表格的第一行插入新行,标注#Ks,提示自己这是序列两两间的非同义突变替换率。
按照刚刚的操作流程,修改参数,再计算Ka,将Ka的结果也保存在该excel中。
利用excel计算Ka/Ks,将>1的位置标注出来,这样就找到了受到正选择的作用的基因。