Fst指数

【转】Fst指数


 
转载自 http://blog.csdn.net/zhu_si_tao/article/details/71513099
与 http://blog.sina.com.cn/s/blog_4ab0b3390102viol.html
群体遗传学--Fst指数,即群体间分化指数,用于群体间分化分析。
群体遗传学中衡量群体间分化程度的指标有很多种,最常用的就是Fst指数。Fst指数,由F统计量演变而来。F统计量(F IS,F IT,F ST)主要有三种。Fst是针对一对等位基因,如果基因座上存在复等位基因,则需要用Gst衡量,基因差异分化系数(gene differentiation coefficient,G st)。

假定有s个地方群体,第k个地方群体相对大小(占比)为w k。在一个基因座上,第k个地方群体中第i个等位基因频率为q k(i),杂合体频率观察值为h k。那么整个群体中观察到的杂合体频率平均值H I,地方群体为理想群体的期望杂合体频率平均值H S,整个群体为理想群体的期望杂合体频率H T,分别为:
F IS,是H I相对于H S减少量的比值,即地方群体的平均近交系数。
F ST,是H S相对于H T减少量的比值,即有亲缘关系地方群体间的平均近交系数。
其中,H S:地方群体为理想群体的期望杂合体频率平均值   H T:整个群体为理想群体的期望杂合体频率
F IT,是H I相对于H T减少量的比值,即整个群体的平均近交系数。
可见,三者在数量上的关系为:
从配子间亲缘关系角度分析,F ST和F IT分别相当于地方群体和整个群体中携带的一对等位基因是同源的概率,而F ST是从两个地方群体中任意抽取的两个配子是同源的概率。从两个地方群体中任意抽取的两个配子是同源的概率大,表明两个地方群体的遗传组成相似,分化程度低;反义,分化程度高。

F ST取值范围[0,1],最大值为1,表明等位基因在各地方群体中固定,完全分化;
最小值为0,意味着不同地方群体遗传结构完全一致,群体间没有分化。

Fst(Fixation index)通常用来衡量population之间的genetic distance。1说明两个population是完全独立的。0说明两个population之间自由interbreeding。Fst值越大,说明genetic distance越远。值越低,说明大多数的genetic variation是发生在同一个population的。

Wright建议,实际研究中,F ST为0~0.05:群体间遗传分化很小,可以不考虑;
F ST为0.05~0.15,群体间存在中等程度的遗传分化;
F ST为0.15~0.25,群体间遗传分化较大;
F ST为0.25以上,群体间有很大的遗传分化。



Pi主要用来衡量每个site的nucleotide divergency。

 

这几个参数同样可以通过vcftools来计算:

 

vcftools:

vcftools --vcf test.vcf  --window-pi 3000  --out Tenera

vcftools --vcf test.vcf  --TajimaD 3000  --out Tenera

vcftools --vcf test.vcf --weir-fst-pop A2.txt --weir-fst-pop A134567.txt --fst-window-size 3000 --out A2.all.Fst 

 



  • 1
    点赞
  • 0
    评论
  • 6
    收藏
  • 扫一扫,分享海报

参与评论
请先登录 后发表评论~
©️2021 CSDN 皮肤主题: 编程工作室 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值