01 目的
根据基因树文件(.tre),使用Seq-Gen v1.3.3的JC69模型,模拟长度为1000 bp的DNA序列。
02 安装Seq-Gen
- 在seq-gen的网站上下载1.33版本的压缩包(Seq-Gen-1.3.3.tar.gz)
- 解压后移动至source文件夹,输入make指令,则生成二进制文件seq-gen
- 将seq-gen的路径写入path中,在命令行输入seq-gen即可执行seq-gen软件
03 模拟DNA序列
# 输入为后缀为.tre的基因树文件,输出为后缀为.phy的dna序列文件
for i in {1..n};do seq-gen -mHKY -l1000 -t0.5 -or -q <phybase$i.tre >phylip$i.phy;done
options:
-m:MODEL = HKY,F84,GTR,JTT,WAG,PAM,BLOSUM,MTREV,GENERAL
其中,HKY,F84,GTR 为核酸模型,其余为氨基酸模型
JC69模型可理解为HKY模型的一种特殊情况,参数为 -mHKY, -t0.5, (-f default = all equal) 时,相当于JC模型
-l:生成的模拟dna序列长度,默认值为1000bp
-t:转换/颠换比(R=si/sv),默认值为1,当认为每个核苷酸发生替换是独立的且每个替换方向概率相等时,R=0.5
-o:输出文件的格式(默认为 PHYLIP )
p PHYLIP format
r relaxed PHYLIP format
n NEXUS format
-q:(Quiet) <input_file >output_file
【指令说明截图】