Ka(dN)代表每非同义位点的碱基替代数,而 Ks(dS)则代表每同义位点的碱基替代数, Ka/Ks的比值常用于判断某个蛋白编码基因是否受到选择压力的作用。一般认为,当 Ka/Ks>1时,则认为有 正选择效应。当 Ka/Ks=1时,则认为存在 中性选择。当 Ka/Ks<1时,则认为有 纯化选择的作用。常用的选择压力Ka/Ks的计算工具有PAML包中的 yn00程序,或 KaKs_calculator等软件。Ks密度曲线分布图常用于判断某一物种在长期的进化过程中是否发生了基因组加倍事件,根据密度曲线对应峰值的Ks值以及该物种核苷酸碱基的替代速率,可以大致计算出该物种发生加倍的进化时间。
加载所需R包
rm(list=ls())
library(ggplot2)
library(reshape2)
设置工作路径并加载数据
setwd("/Users/Davey/Desktop")
data
data
#去除缺失的行
data = na.omit(data)
head(data)
## Species Ks
## 1 SpeciesA_SpeciesB 0.0915
## 2 SpeciesA_SpeciesB 0.2535
## 3 SpeciesA_SpeciesB 0.0386
## 4 SpeciesA_SpeciesB 0.1385
## 5 SpeciesA_SpeciesB 0.1125
## 6 SpeciesA_SpeciesB 0.1960
使用ggplot2绘图
p1
geom_density() + xlim(0,1)