Github/mmatschiner的phylogenetic & phylogenomic学习教程记录【一】多序列比对;核算替换模型的选择;最大似然法建树的学习
[TOC]
软件准备Preparation
Basics
Bash
Ruby 2; 版本> 2
Python 3
R
安装包Libraries
Python3的安装包:包括有numpy, scipy msprime
R安装包:包括有ape, coda,用于introgression分析。
软件Programs
MAFFT: 多序列比对软件;MAFFT
AliView: 多序列比对的可视化软件;AliView
BMGE: 多序列比对后保守序列区段鉴别软件,polish软件;类似熟悉的Gblocks。BMGE
PAUP: 系统发育分析软件MP法;PAUP*
FigTree系统树的可视化软件;FigTree
BEAST2分子进化;分子时间计算经典软件;https://www.beast2.org
TracerBayesian贝叶斯树的后验计算;Tracer
Blast+ 经典序列比对blast软件;Blast
ASTRAL 根据基因树来推断物种树的软件;ASTRAL
Abyss 同组装相关软件;Abyss
BWA 短序列比对软件;BWA
bcftools vcf文件操作软件;bcftools
Dsuite 计算Introgression的D-statistics数值软件;Dsuite
Relate 大规模样本数据计算谱系历史的软件;较新的软件;Relate
多序列比对
Outline
多序列比对是系统发育分析的基础;其目的是为了确定序列之间同源的区段(homologous nucleotides可比较的序列);本节为了解决以下问题:
利用MAFFT软件做多序列比对;
鉴定并排除可能错误比对的序列区段;
利用公共数据库NCBI GeneBank补全已有的数据集合;
Datasets
数据来源于Matschiner et al. 2017。此为研究cichlid(慈鲷科鱼种)在各大