1、对于执行检测选择压力需要有三个文件:序列文件,以nuc格式或PML格式居多,需要通过PAMBE进行转换文件格式,通常以fasta转PML居多;假设使用序列为未必对过的原始序列,可以用MEGA进行Alignment后,则需要通过BWA,Clustalw等进行多序列比对,生成fas文件后进行格式文件转化处理,利用DMABE。
第二个文件,树文件,通常以*.trees作为文件名,在树文件中需要存在两种元素,第一种为ete3所定义的format=9的树格式,需要将物种名改为数字,且数字不包含0,接下来的是树的原始格式,包含物种名,Internal_branch_length以及External_branch_length。
第三个文件为control_file,主要包含了文件的储存位置以及所要执行的选择模式(如:零假设或者替代假设,零假设为model=0,替代假设为model=2),采用的codon_Freq为F3x4。
2、选择过程执行
对于某一个group,其中所有speices进行零假设,则选用在其后枝上加$1,对于单个Internal_branch则选用在其后加上#1.