系统发生分析1——经典序列分析

2023年,《Plos one》发表综述文章,概述了一系列DNA和蛋白质数据库,以及用于系统发育重建和广泛的分子进化研究的生物信息学工具,为蛋白质和基因进化研究的初学者和高级探索者提供实用指

核酸数据库

Database Features
BAR植物基因和蛋白质数据库
http://bar.utoronto.ca/
Bgee基因表达模式
https://bgee.org/
Ensembl脊椎动物基因组浏览器,包括用于识别同源性的工具
https://www.ensembl.org/index.htm
Entrez基因序列和结构https://www.ncbi.nlm.nih.gov/Web/Search/entrezfs.html
FlyBase黑腹果蝇模型昆虫的基因组和蛋白质组https://flybase.org/
GeneCards人类基因功能、基因组学、转录因子结合位点和蛋白质产物
https://www.genecards.org/
GenBank注释DNA序列
https://www.ncbi.nlm.nih.gov/genbank/
NCBI分子生物学和医学数据库的集合,提供许多生物信息学工具和服务
https://www.ncbi.nlm.nih.gov/
PomBase模式酵母S.pombe的基因组和蛋白质组
https://www.pombase.org/
TAIR模式植物拟南芥的基因组和蛋白质组
https://www.arabidopsis.org/
WormBase秀丽隐杆线虫模型的基因组和蛋白质组https://wormbase.org//#012-34-5
Xenbase模式两栖动物X.laevis的基因组和蛋白质组
http://www.xenbase.org/entry/

蛋白数据库

Database Features
CATH根据结构、功能和进化对蛋白质结构域进行分类
https://www.cathdb.info/
FSSP根据结构相似性对蛋白质结构域进行分类
http://srs.ebi.ac.uk/srsbin/cgi-bin/
-wgetz?-page+LibInfo±id+5Ti2u1RffMj±lib+FSSP
Gene Ontology统一注释蛋白质的分子功能、生物过程
和细胞成分
http://geneontology.org/
Human ProteinAtlas关于人类蛋白质及其与疾病联系的信息
https://www.proteinatlas.org/
InterPro蛋白质结构域和功能位点的分类
https://www.ebi.ac.uk/interpro/
KEGG蛋白质功能和生物途径
https://www.genome.jp/kegg/
PDB蛋白质的三维结构
https://www.rcsb.org/
Pfam关于蛋白质家族和结构域的信息
http://pfam.xfam.org/
PHAROS集中人类蛋白质文献
https://pharos.nih.gov/
PRINTS蛋白质指纹图谱分类数据库
http://www.bioinf.man.ac.uk/dbbrowser
-/PRINTS/
PROSITE蛋白质家族数据库
https://prosite.expasy.org/
SCOP根据结构、功能和进化对蛋白质结构域进行分类
https://scop.mrc-lmb.cam.ac.uk/
SUPERFAMILY蛋白质结构和功能
https://supfam.org/
UniProt蛋白质的一般信息,包括序列、结构、分类、功能、亚细胞定位和简单的同源性鉴定
https://www.uniprot.org/uniprot/

用于识别基因和蛋白质同源物的生物信息学工具

DatabaseFeatures
BLAST在 NCBI 中进行蛋白质或 DNA 同源搜索
https://blast.ncbi.nlm.nih.gov/Blast.cgi
BLAT动物基因组中的蛋白质或 DNA 同源搜索
https://genome.ucsc.edu/cgi-bin/hgBlat
Ensembl脊椎动物基因组浏览器,包括用于识别同源性的工具
https://m.ensembl.org/index.html
FASTA蛋白质或 DNA 同源搜索和序列比对
https://www.ebi.ac.uk/Tools/sss/fasta/
HMMER基因和蛋白质同源性搜索
http://hmmer.org/
Pfam蛋白质家族和结构域,包括用于识别同源性的工具
http://pfam.xfam.org/
SSAHADNA 序列搜索和比对
https://www.sanger.ac.uk/tool/ssaha/
UniProt蛋白质的一般信息,包括用于识别相似性的工具
https://www.uniprot.org/uniprot/

多序列比对工具

SoftwareFeatures
BAli-Phy使用 BI 对核苷酸和氨基酸序列进行多序列比对和系统进化分析
http://www.bali-phy.org
CLUSTAL Omega*针对核苷酸或氨基酸数据的快速多序列比对
https://www.ebi.ac.uk/Tools/msa/clustalo/
CLUSTALW*核苷酸或氨基酸数据的多序列比对
https://www.genome.jp/tools-bin/clustalw
CONTRAlign(ProbCons)以准确性为导向的氨基酸数据多序列比对
http://contra.stanford.edu/contralign/
Kalign*针对核苷酸或氨基酸数据的快速多序列比对
https://www.ebi.ac.uk/Tools/msa/kalign/
MAFFT*核苷酸或氨基酸数据的多序列比对
https://mafft.cbrc.jp/alignment/server/
MUSCLE*核苷酸或氨基酸数据的多序列比对
https://www.ebi.ac.uk/Tools/msa/muscle/
PASTA针对核苷酸或氨基酸数据的快速多序列比对,专为超大数据集而设计
https://bioinformaticshome.com/tools/msa/descriptions/PASTA.html
PRANK/WebPRANK*核苷酸或氨基酸数据的多序列比对,应优先考虑近似序列
http://wasabiapp.org/software/prank/
https://www.ebi.ac.uk/goldman-srv/webprank/
SATe关于基因编码蛋白质潜在靶标的信息
https://phylo.bio.ku.edu/software/sate/sate.html
T-COFFEE*核苷酸和氨基酸序列的多序列比对
http://tcoffee.crg.cat/
UPP针对核苷酸或氨基酸数据的快速多序列比对,专为超大数据集而设计
https://github.com/smirarab/sepp

序列比对剪切工具

SoftwareFeatures
AliStat量化比对完整性,以优化比对
https://github.com/thomaskf/AliStat
BMGE在多序列比对中选择信息区域
https://gitlab.pasteur.fr/GIPhy/BMGE
GBlocks在多序列比对中选择信息区域
http://molevol.cmima.csic.es/castresana/
-Gblocks.html
Guidance 2*在多序列比对中选择信息区域
http://guidance.tau.ac.il/
Noisy在多序列比对中选择信息区域
http://www.bioinf.uni-leipzig.de/Software/noisy/
trimAl在多序列比对中选择信息区域
nts http://trimal.cgenomics.org/

分子进化模型选择工具

SoftwareFeatures
ModelFinder基于位点(核苷酸、氨基酸、密码子)间速率异质性模型的快速模型选择方法
Implemented in IQ-Tree
ModelTest /jModelTest核苷酸替代模型选择
http://evomics.org/resources/software/
molecular-evolution-software/modeltest/
PartitionFinder 2分子进化模型选择
http://www.robertlanfear.com/partitionfinder/
ProtTest氨基酸替代模型选择(核苷酸、氨基酸)
https://github.com/ddarriba/prottest3
SMSPhyML中包含的核苷酸或氨基酸模型选择(核苷酸、氨基酸)
http://www.atgc-montpellier.fr/sms/

使用距离法、最大简约法、最大似然法和贝叶斯推理进行系统发育分析的工具

SoftwareFeatures
APE基于距离方法的分子系统发育R编写包http://ape-package.ird.fr
BAli-Phy基于BI的系统发育推断
http://www.bali-phy.org
BayesTraits使用BI进行系统发育推理和其他进化分析
http://www.evolution.reading.ac.uk/-BayesTraitsV4.0.0/BayesTraitsV4.0.0.html
FastMe*基于距离方法的系统发育推理
http 😕/www.atgc-montpellier.fr/fastme/
GARLI使用ML进行系统发育推理
http 😕/evomics.org/resources/software/molecular-evolution-software/garli/
HYPHY*使用ML和距离方法进行系统发育推理
https 😕/www.hyphy.org/
IQ-TREE*使用 ML 进行系统发育推断,包括模型选择和快速引导法
http 😕/www.iqtree.org/
MEGA序列比对、模型选择、使用距离法、MP 和 ML 进行系统进化分析以及其他进化分析
https://www.megasoftware.net/
MrBayes使用BI和各种进化分析进行系统发育推断,包括祖先重建和时间校准
http://nbisweden.github.io/MrBayes/
PAML使用ML进行系统发育推断、选择强度估计、祖先重建和其他进化分析
http://abacus.gene.ucl.ac.uk/software/paml.html
PAUP使用 MP 和 ML 进行系统发育推断
http://paup.phylosolutions.com/
PHYLIP利用MP、距离法和ML进行系统发育推理
https 😕/evolution.genetics.washington.edu/phylip.html
PhyloBayes使用特定概率模型使用BI对蛋白质数据进行系统发育推断
http 😕/www.atgc-montpellier.fr/phylobayes/
PhyML*基于机器学习的系统发育推断、祖先重建和各种进化分析
http://atgc.lirmm.fr/phyml/
PyCogent系统发育推理、树形图绘制、各种进化分析,包括分区模型和祖先重建
https 😕/github.com/pycogent/pycogent
RAxML*使用ML进行系统发育推理
https://cme.h-its.org/exelixis/web/software/raxml/
SeaView利用MP、NJ和ML进行序列比对和系统发育推断
http://doua.prabi.fr/software/seaview
SplitsTree无根树和系统发育网络的系统发育推断
https 😕/uni-tuebingen.de/fakultaeten/mathematisch-naturwissenschaftliche-fakultaet/fachbereiche/informatik/lehrstuehle/-algorithms-in-bioinformatics/software/splitstree/

系统发育树图形可视化和注释工具

SoftwareFeatures
ETEToolkit系统发育树的可视化与分析
http://etetoolkit.org/
FigTree系统发育树图形软件
https://github.com/rambaut/figtree/releases
ITOL*系统发育树的可视化和注释
https://itol.embl.de/
MEGA序列比对、模型选择、系统发育分析,包括树可视化和注释工具
https://www.megasoftware.net/
SeaView序列比对和系统发育推断,包括树可视化和注释工具
http://doua.prabi.fr/software/seaview

用于系统发育分析和进化研究的软件包

SoftwareFeatures
Bio++系统发育分析软件包
https://github.com/BioPP
CIPRES进化研究资源,包括序列比对、模型选择和系统发育推断程序
https://www.phylo.org/
HyPhy系统发育分析软件包
https://www.hyphy.org/
GeneiousNGS数据组装和多样化进化研究平台 https://www.geneious.com/
NGPhylogeny集成了多种系统发育分析方法和工具的工作流程
https://ngphylogeny.fr
Phylemon2用于分子进化、系统发育学、系统基因组学和假设检验的web工具
http://phylemon.bioinfo.cipf.es/index.html

用于补充系统发育分析的各种进化分析的工具和数据库

SoftwareFeatures
Arlequin群体遗传学分析
http://cmpg.unibe.ch/software/arlequin35/
BayesTraits基于贝叶斯推理的进化分析
http://www.evolution.reading.ac.uk/BayesTraitsV4.0.0/BayesTraitsV4.0.0.html
BEAST使用BI进行多样化的进化分析,包括系统发育树的时间校准
http://www.beast.community
CAFE基因家族进化
https://github.com/hahnlab/CAFE5
CoGE比较基因组学分析
https://genomevolution.org/coge/
Copycat共同进化研究
http://www.cophylogenetics.com/
CoRe-PA共同进化研究
http://pacosy.informatik.uni-leipzig.de/49-1-CoRe-PA.html
DNAspDNA多态性分析
http://www.ub.edu/dnasp/
Genepop群体遗传学分析
https://genepop.curtin.edu.au/
HGT-Finder水平基因转移发现
https://github.com/yinlabniu/HGT-Finder
IQ-TREE,IQ-TREE2祖先重建
http 😕/www.iqtree.org/
Jane共同进化研究
https://www.cs.hmc.edu/~hadas/jane/
LSD系统发育树的时间校准
http 😕/www.atgc-montpellier.fr/LSD/
Mesquite比较分析和统计
http://www.mesquiteproject.org/
Ohnologs源自全基因组复制的脊椎动物同源基因数据库
http://ohnologs.curie.fr/
PyCogent大量进化分析,包括分区模型和系统进化分析、树形图绘制和祖先重建
https 😕/github.com/pycogent/pycogent
RASP祖先重建
http://mnh.scu.edu.cn/soft/blog/RASP/index.html
SNiplaySNP检测和其他群体遗传学分析
https://sniplay.southgreen.fr/cgi-bin/home.cgi
TimeTree系统发育树的剪切校准
http://www.timetree.org/
TreeMap用于研究共同进化的软件
https://sites.google.com/site/cophylogeny/treemap

蛋白质结构分析工具

SoftwareFeatures
Alpha fold从氨基酸序列预测蛋白质结构
https://alphafold.ebi.ac.uk/
FoRSA从氨基酸序列预测蛋白质结构
http://www.bo-protscience.fr/forsa/
HHPred从氨基酸序列预测蛋白质结构
https://toolkit.tuebingen.mpg.de/tools/hhpred
I-TASSER从氨基酸序列预测蛋白质结构 https://zhanglab.dcmb.med.umich.edu/I-TASSER/
PyMOL分子的三维可视化
http://www.mesquiteproject.org/ https://pymol.org/2/

参考:
https://mp.weixin.qq.com/s/gmGfXjJy3ATi79Otffs5PQ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值