群体Polymorphism information content(PIC)、 Nei’s diversity index (Nei’s) 和 Shannon’s index (I)计算方法
1. Polymorphism information content(PIC)
根据文献参考1,Polymorphism information content(PIC)用于衡量标记的多态性,PIC值取决于等位基因的个数和等位基因的频率分布两个因素,因此用来反应基因的多样性。
PIC值由Bostein 1980年公布的公式如下(参考文献2):
pi
and pj
are allele frequencies at alleles i and j, respectively;
n
is the number of alleles.
计算步骤实际上是1减去每个pi和pj的平方和,再减去非重复取两个p的平方积的2倍(Cn 2,如果是3个位点有3种;6个位点那就是6*5/2=15种组合)
两个等位基因的标记则计算:
1 - a2 - b2 - 2*a2*b2
三个等位基因的标记则计算:
a, b,c
1 - a2 - b2 - c2 - 2*a2b2 - 2b2c2 - 2a2*c2
require(polysat) ## call PIC function
> a
Genomes loc2.150 loc2.155 loc2.160
pop1 20 0.4 0.3 0.3
pop2 30 0.5 0.2 0.3
> PIC(a) ## PIC 计算结果
loc2
pop1 0.5862000
pop2 0.5478000
Overall 0.5679677
> a ## 以pop2为例子
[1] 0.5 0.3 0.2
> b=2*a^2 %*% t(a^2)
> 1 - sum(a^2) - sum(b[upper.tri(b) ])
[1] 0.5478 ## 与上面函数计算结果相同
## overall结果是将三个位置的allele freq按照群体进行比例计算,得到新的AF为0.46, 0.24, 0.3
最终按照上面的步骤结果为:
> b
Genomes loc2.150 loc2.155 loc2.160
pop1 50 0.46 0.24 0.3
> a1=as.vector(unlist(b[,2:4]))
> a1
[1] 0.46 0.24 0.30
> 1- sum(a1^2)
[1] 0.6408
> a2=a1^2 %*% t(a1^2)
> a2
[,1] [,2] [,3]
[1,] 0.04477456 0.01218816 0.019044
[2,] 0.01218816 0.00331776 0.005184
[3,] 0.01904400 0.00518400 0.008100
> 2*a2[upper.tri(a2)]
[1] 0.02437632 0.03808800 0.01036800
> 1- sum(a1^2) - sum(2*(a2[upper.tri(a2)]))
[1] 0.5679677 ## 与前面overall结果相同
此外,也有将PIC公式简化的使用方法,此时与杂合度计算公式相似:
以上两种方法均有使用文献例子,但是使用第三方软件时注意其计算方式,在描述时就能准确写出计算方法。
2. Nei’s diversity index (Nei’s)
Nei (1973) 定义该指数,用来代表未鉴定的遗传变异,是群体遗传变异的一个测量值,代表群体内遗传多样性
。
在随机交配群体中,该指数为杂合度;
在非随机交配群体中,该描述不合适,因此使用基因多样性(gene diversity)。
He
计算公式如下:
1973年Nei的论文中计算公式为:
H=1-Σpi2 (Nei, 1973)
可能最开始提出的是这个,后面找到一个PPT中发现会使用平均杂合度(He)来表示H。
该指数值阈在0到1之间,0代表无多样性。
3. Shannon’s index (I)
Shannon & Weaver (1949) 提出该指数,通常用于生态学研究中,用来估计物种多样性
。
计算公式如下:
其他具体的计算例子可以参考链接6。
该指数最小值为0,代表无多样性,调查区域内均来自同一个物种;
反之该值不存在上限,不同群体间个体相同,该值取决于物种内的个体数目。
该指数的计算公式中ln可以使用log2等,这个是人为选择的。所以有人使用自然数e为底的对数,也有人选择其他数eg:2等。
此外,R语言并未内置ln函数,想要计算ln值,使用方式需要如下(或者调用其他R包辅助):
> log2(4)
[1] 2
> log(1,exp(1))
[1] 0
所以计算x的自然数e的对数值为:
> log(x,exp(1))
> log(3,exp(1))
[1] 1.098612
参考:
- http://www.agrobiology.ru/articles/5-2015chesnokov.pdf
- https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1686077/pdf/ajhg00189-0020.pdf
- https://cncbc.mee.gov.cn/kpzs/rsswdyx/201506/t20150610_303290.html
- https://link.springer.com/content/pdf/10.1007/BF00039724.pdf
- https://www.ncbi.nlm.nih.gov/pmc/articles/PMC427228/pdf/pnas00139-0051.pdf
- https://www.omnicalculator.com/ecology/shannon-index