snp的分析中,有需求算pie值和theta值,也就是核苷酸多样性指样本中所有可能匹配成对的序列间核苷酸位点差异百分比的平均值,用π值表示。以及核苷酸多态性,是指从基因组中所研究的DNA区域中抽取任何样本,核苷酸位点是核苷酸多态位点百分比的期望值,常用θ表示。先讨论π值。
公式从群体遗传学书籍中得到。
但是一般还是用估算式。
其中S可以用此snp位点的第一碱基和第二碱基的数目积求算。
附上perl语言计算函数。
sub pi
{
my $aSed; my $aMax;
$aSed=$_[0]; $aMax=$_[1];
my $c2=($aSed+$aMax)*($aSed+$aMax-1);
if($c2==0) {return 0;}
my $piValue=($aSed*$aMax)*2/$c2;
return $piValue;
}
其中$aSed是第二碱基的数目,$Max是第一碱基的数目。