群体Polymorphism information content(PIC)、 Nei diversity index (Nei s) 和 Shannon index (I)计算方法

群体Polymorphism information content(PIC)、 Nei’s diversity index (Nei’s) 和 Shannon’s index (I)计算方法
1. Polymorphism information content(PIC)

根据文献参考1,Polymorphism information content(PIC)用于衡量标记的多态性,PIC值取决于等位基因的个数和等位基因的频率分布两个因素,因此用来反应基因的多样性。
PIC值由Bostein 1980年公布的公式如下(参考文献2):
在这里插入图片描述
pi and pj are allele frequencies at alleles i and j, respectively;
n is the number of alleles.
计算步骤实际上是1减去每个pi和pj的平方和,再减去非重复取两个p的平方积的2倍(Cn 2,如果是3个位点有3种;6个位点那就是6*5/2=15种组合)

两个等位基因的标记则计算:
1 - a2 - b2 - 2*a2*b2

三个等位基因的标记则计算:
a, b,c
1 - a2 - b2 - c2 - 2*a2b2 - 2b2c2 - 2a2*c2

require(polysat) ## call PIC function
> a     
     Genomes loc2.150 loc2.155 loc2.160
pop1      20      0.4      0.3      0.3
pop2      30      0.5      0.2      0.3

> PIC(a)   ## PIC 计算结果
             loc2
pop1    0.5862000
pop2    0.5478000
Overall 0.5679677

> a  ## 以pop2为例子
[1] 0.5 0.3 0.2
> b=2*a^2 %*% t(a^2)
> 1 - sum(a^2) - sum(b[upper.tri(b) ])
[1] 0.5478  ## 与上面函数计算结果相同

## overall结果是将三个位置的allele freq按照群体进行比例计算,得到新的AF为0.46, 0.24, 0.3
最终按照上面的步骤结果为:
> b
     Genomes loc2.150 loc2.155 loc2.160
pop1      50     0.46     0.24      0.3
> a1=as.vector(unlist(b[,2:4]))
> a1
[1] 0.46 0.24 0.30
> 1- sum(a1^2)
[1] 0.6408
> a2=a1^2 %*% t(a1^2)
> a2
           [,1]       [,2]     [,3]
[1,] 0.04477456 0.01218816 0.019044
[2,] 0.01218816 0.00331776 0.005184
[3,] 0.01904400 0.00518400 0.008100
> 2*a2[upper.tri(a2)]
[1] 0.02437632 0.03808800 0.01036800
> 1- sum(a1^2) - sum(2*(a2[upper.tri(a2)]))  
[1] 0.5679677  ## 与前面overall结果相同

此外,也有将PIC公式简化的使用方法,此时与杂合度计算公式相似:
在这里插入图片描述
以上两种方法均有使用文献例子,但是使用第三方软件时注意其计算方式,在描述时就能准确写出计算方法。

2. Nei’s diversity index (Nei’s)

Nei (1973) 定义该指数,用来代表未鉴定的遗传变异,是群体遗传变异的一个测量值,代表群体内遗传多样性
在随机交配群体中,该指数为杂合度;
在非随机交配群体中,该描述不合适,因此使用基因多样性(gene diversity)。
He计算公式如下:
1973年Nei的论文中计算公式为:
H=1-Σpi2 (Nei, 1973)

可能最开始提出的是这个,后面找到一个PPT中发现会使用平均杂合度(He)来表示H。
在这里插入图片描述在这里插入图片描述该指数值阈在0到1之间,0代表无多样性。

3. Shannon’s index (I)

Shannon & Weaver (1949) 提出该指数,通常用于生态学研究中,用来估计物种多样性
计算公式如下:
在这里插入图片描述
其他具体的计算例子可以参考链接6。
在这里插入图片描述
该指数最小值为0,代表无多样性,调查区域内均来自同一个物种;
反之该值不存在上限,不同群体间个体相同,该值取决于物种内的个体数目。

该指数的计算公式中ln可以使用log2等,这个是人为选择的。所以有人使用自然数e为底的对数,也有人选择其他数eg:2等。

此外,R语言并未内置ln函数,想要计算ln值,使用方式需要如下(或者调用其他R包辅助):

> log2(4)
[1] 2

> log(1,exp(1))
[1] 0

所以计算x的自然数e的对数值为:
> log(x,exp(1))
> log(3,exp(1))
[1] 1.098612

参考:

  1. http://www.agrobiology.ru/articles/5-2015chesnokov.pdf
  2. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1686077/pdf/ajhg00189-0020.pdf
  3. https://cncbc.mee.gov.cn/kpzs/rsswdyx/201506/t20150610_303290.html
  4. https://link.springer.com/content/pdf/10.1007/BF00039724.pdf
  5. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC427228/pdf/pnas00139-0051.pdf
  6. https://www.omnicalculator.com/ecology/shannon-index
  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值