2023年,《Plos one》发表综述文章,概述了一系列DNA和蛋白质数据库,以及用于系统发育重建和广泛的分子进化研究的生物信息学工具,为蛋白质和基因进化研究的初学者和高级探索者提供实用指
核酸数据库
Database | Features | |
---|---|---|
BAR | 植物基因和蛋白质数据库 http://bar.utoronto.ca/ | |
Bgee | 基因表达模式 https://bgee.org/ | |
Ensembl | 脊椎动物基因组浏览器,包括用于识别同源性的工具 https://www.ensembl.org/index.htm | |
Entrez | 基因序列和结构https://www.ncbi.nlm.nih.gov/Web/Search/entrezfs.html | |
FlyBase | 黑腹果蝇模型昆虫的基因组和蛋白质组https://flybase.org/ | |
GeneCards | 人类基因功能、基因组学、转录因子结合位点和蛋白质产物 https://www.genecards.org/ | |
GenBank | 注释DNA序列 https://www.ncbi.nlm.nih.gov/genbank/ | |
NCBI | 分子生物学和医学数据库的集合,提供许多生物信息学工具和服务 https://www.ncbi.nlm.nih.gov/ | |
PomBase | 模式酵母S.pombe的基因组和蛋白质组 https://www.pombase.org/ | |
TAIR | 模式植物拟南芥的基因组和蛋白质组 https://www.arabidopsis.org/ | |
WormBase | 秀丽隐杆线虫模型的基因组和蛋白质组https://wormbase.org//#012-34-5 | |
Xenbase | 模式两栖动物X.laevis的基因组和蛋白质组 http://www.xenbase.org/entry/ |
蛋白数据库
Database | Features | |
---|---|---|
CATH | 根据结构、功能和进化对蛋白质结构域进行分类 https://www.cathdb.info/ | |
FSSP | 根据结构相似性对蛋白质结构域进行分类 http://srs.ebi.ac.uk/srsbin/cgi-bin/ -wgetz?-page+LibInfo±id+5Ti2u1RffMj±lib+FSSP | |
Gene Ontology | 统一注释蛋白质的分子功能、生物过程 和细胞成分 http://geneontology.org/ | |
Human ProteinAtlas | 关于人类蛋白质及其与疾病联系的信息 https://www.proteinatlas.org/ | |
InterPro | 蛋白质结构域和功能位点的分类 https://www.ebi.ac.uk/interpro/ | |
KEGG | 蛋白质功能和生物途径 https://www.genome.jp/kegg/ | |
PDB | 蛋白质的三维结构 https://www.rcsb.org/ | |
Pfam | 关于蛋白质家族和结构域的信息 http://pfam.xfam.org/ | |
PHAROS | 集中人类蛋白质文献 https://pharos.nih.gov/ | |
PRINTS | 蛋白质指纹图谱分类数据库 http://www.bioinf.man.ac.uk/dbbrowser -/PRINTS/ | |
PROSITE | 蛋白质家族数据库 https://prosite.expasy.org/ | |
SCOP | 根据结构、功能和进化对蛋白质结构域进行分类 https://scop.mrc-lmb.cam.ac.uk/ | |
SUPERFAMILY | 蛋白质结构和功能 https://supfam.org/ | |
UniProt | 蛋白质的一般信息,包括序列、结构、分类、功能、亚细胞定位和简单的同源性鉴定 https://www.uniprot.org/uniprot/ |
用于识别基因和蛋白质同源物的生物信息学工具
Database | Features | |
---|---|---|
BLAST | 在 NCBI 中进行蛋白质或 DNA 同源搜索 https://blast.ncbi.nlm.nih.gov/Blast.cgi | |
BLAT | 动物基因组中的蛋白质或 DNA 同源搜索 https://genome.ucsc.edu/cgi-bin/hgBlat | |
Ensembl | 脊椎动物基因组浏览器,包括用于识别同源性的工具 https://m.ensembl.org/index.html | |
FASTA | 蛋白质或 DNA 同源搜索和序列比对 https://www.ebi.ac.uk/Tools/sss/fasta/ | |
HMMER | 基因和蛋白质同源性搜索 http://hmmer.org/ | |
Pfam | 蛋白质家族和结构域,包括用于识别同源性的工具 http://pfam.xfam.org/ | |
SSAHA | DNA 序列搜索和比对 https://www.sanger.ac.uk/tool/ssaha/ | |
UniProt | 蛋白质的一般信息,包括用于识别相似性的工具 https://www.uniprot.org/uniprot/ |
多序列比对工具
Software | Features | |
---|---|---|
BAli-Phy | 使用 BI 对核苷酸和氨基酸序列进行多序列比对和系统进化分析 http://www.bali-phy.org | |
CLUSTAL Omega* | 针对核苷酸或氨基酸数据的快速多序列比对 https://www.ebi.ac.uk/Tools/msa/clustalo/ | |
CLUSTALW* | 核苷酸或氨基酸数据的多序列比对 https://www.genome.jp/tools-bin/clustalw | |
CONTRAlign(ProbCons) | 以准确性为导向的氨基酸数据多序列比对 http://contra.stanford.edu/contralign/ | |
Kalign* | 针对核苷酸或氨基酸数据的快速多序列比对 https://www.ebi.ac.uk/Tools/msa/kalign/ | |
MAFFT* | 核苷酸或氨基酸数据的多序列比对 https://mafft.cbrc.jp/alignment/server/ | |
MUSCLE* | 核苷酸或氨基酸数据的多序列比对 https://www.ebi.ac.uk/Tools/msa/muscle/ | |
PASTA | 针对核苷酸或氨基酸数据的快速多序列比对,专为超大数据集而设计 https://bioinformaticshome.com/tools/msa/descriptions/PASTA.html | |
PRANK/WebPRANK* | 核苷酸或氨基酸数据的多序列比对,应优先考虑近似序列 http://wasabiapp.org/software/prank/ https://www.ebi.ac.uk/goldman-srv/webprank/ | |
SATe | 关于基因编码蛋白质潜在靶标的信息 https://phylo.bio.ku.edu/software/sate/sate.html | |
T-COFFEE* | 核苷酸和氨基酸序列的多序列比对 http://tcoffee.crg.cat/ | |
UPP | 针对核苷酸或氨基酸数据的快速多序列比对,专为超大数据集而设计 https://github.com/smirarab/sepp |
序列比对剪切工具
Software | Features | |
---|---|---|
AliStat | 量化比对完整性,以优化比对 https://github.com/thomaskf/AliStat | |
BMGE | 在多序列比对中选择信息区域 https://gitlab.pasteur.fr/GIPhy/BMGE | |
GBlocks | 在多序列比对中选择信息区域 http://molevol.cmima.csic.es/castresana/ -Gblocks.html | |
Guidance 2* | 在多序列比对中选择信息区域 http://guidance.tau.ac.il/ | |
Noisy | 在多序列比对中选择信息区域 http://www.bioinf.uni-leipzig.de/Software/noisy/ | |
trimAl | 在多序列比对中选择信息区域 nts http://trimal.cgenomics.org/ |
分子进化模型选择工具
Software | Features | |
---|---|---|
ModelFinder | 基于位点(核苷酸、氨基酸、密码子)间速率异质性模型的快速模型选择方法 Implemented in IQ-Tree | |
ModelTest /jModelTest | 核苷酸替代模型选择 http://evomics.org/resources/software/ molecular-evolution-software/modeltest/ | |
PartitionFinder 2 | 分子进化模型选择 http://www.robertlanfear.com/partitionfinder/ | |
ProtTest | 氨基酸替代模型选择(核苷酸、氨基酸) https://github.com/ddarriba/prottest3 | |
SMS | PhyML中包含的核苷酸或氨基酸模型选择(核苷酸、氨基酸) http://www.atgc-montpellier.fr/sms/ |
使用距离法、最大简约法、最大似然法和贝叶斯推理进行系统发育分析的工具
Software | Features | |
---|---|---|
APE | 基于距离方法的分子系统发育R编写包http://ape-package.ird.fr | |
BAli-Phy | 基于BI的系统发育推断 http://www.bali-phy.org | |
BayesTraits | 使用BI进行系统发育推理和其他进化分析 http://www.evolution.reading.ac.uk/-BayesTraitsV4.0.0/BayesTraitsV4.0.0.html | |
FastMe* | 基于距离方法的系统发育推理 http 😕/www.atgc-montpellier.fr/fastme/ | |
GARLI | 使用ML进行系统发育推理 http 😕/evomics.org/resources/software/molecular-evolution-software/garli/ | |
HYPHY* | 使用ML和距离方法进行系统发育推理 https 😕/www.hyphy.org/ | |
IQ-TREE* | 使用 ML 进行系统发育推断,包括模型选择和快速引导法 http 😕/www.iqtree.org/ | |
MEGA | 序列比对、模型选择、使用距离法、MP 和 ML 进行系统进化分析以及其他进化分析 https://www.megasoftware.net/ | |
MrBayes | 使用BI和各种进化分析进行系统发育推断,包括祖先重建和时间校准 http://nbisweden.github.io/MrBayes/ | |
PAML | 使用ML进行系统发育推断、选择强度估计、祖先重建和其他进化分析 http://abacus.gene.ucl.ac.uk/software/paml.html | |
PAUP | 使用 MP 和 ML 进行系统发育推断 http://paup.phylosolutions.com/ | |
PHYLIP | 利用MP、距离法和ML进行系统发育推理 https 😕/evolution.genetics.washington.edu/phylip.html | |
PhyloBayes | 使用特定概率模型使用BI对蛋白质数据进行系统发育推断 http 😕/www.atgc-montpellier.fr/phylobayes/ | |
PhyML* | 基于机器学习的系统发育推断、祖先重建和各种进化分析 http://atgc.lirmm.fr/phyml/ | |
PyCogent | 系统发育推理、树形图绘制、各种进化分析,包括分区模型和祖先重建 https 😕/github.com/pycogent/pycogent | |
RAxML* | 使用ML进行系统发育推理 https://cme.h-its.org/exelixis/web/software/raxml/ | |
SeaView | 利用MP、NJ和ML进行序列比对和系统发育推断 http://doua.prabi.fr/software/seaview | |
SplitsTree | 无根树和系统发育网络的系统发育推断 https 😕/uni-tuebingen.de/fakultaeten/mathematisch-naturwissenschaftliche-fakultaet/fachbereiche/informatik/lehrstuehle/-algorithms-in-bioinformatics/software/splitstree/ |
系统发育树图形可视化和注释工具
Software | Features | |
---|---|---|
ETEToolkit | 系统发育树的可视化与分析 http://etetoolkit.org/ | |
FigTree | 系统发育树图形软件 https://github.com/rambaut/figtree/releases | |
ITOL* | 系统发育树的可视化和注释 https://itol.embl.de/ | |
MEGA | 序列比对、模型选择、系统发育分析,包括树可视化和注释工具 https://www.megasoftware.net/ | |
SeaView | 序列比对和系统发育推断,包括树可视化和注释工具 http://doua.prabi.fr/software/seaview |
用于系统发育分析和进化研究的软件包
Software | Features | |
---|---|---|
Bio++ | 系统发育分析软件包 https://github.com/BioPP | |
CIPRES | 进化研究资源,包括序列比对、模型选择和系统发育推断程序 https://www.phylo.org/ | |
HyPhy | 系统发育分析软件包 https://www.hyphy.org/ | |
Geneious | NGS数据组装和多样化进化研究平台 https://www.geneious.com/ | |
NGPhylogeny | 集成了多种系统发育分析方法和工具的工作流程 https://ngphylogeny.fr | |
Phylemon2 | 用于分子进化、系统发育学、系统基因组学和假设检验的web工具 http://phylemon.bioinfo.cipf.es/index.html |
用于补充系统发育分析的各种进化分析的工具和数据库
Software | Features | |
---|---|---|
Arlequin | 群体遗传学分析 http://cmpg.unibe.ch/software/arlequin35/ | |
BayesTraits | 基于贝叶斯推理的进化分析 http://www.evolution.reading.ac.uk/BayesTraitsV4.0.0/BayesTraitsV4.0.0.html | |
BEAST | 使用BI进行多样化的进化分析,包括系统发育树的时间校准 http://www.beast.community | |
CAFE | 基因家族进化 https://github.com/hahnlab/CAFE5 | |
CoGE | 比较基因组学分析 https://genomevolution.org/coge/ | |
Copycat | 共同进化研究 http://www.cophylogenetics.com/ | |
CoRe-PA | 共同进化研究 http://pacosy.informatik.uni-leipzig.de/49-1-CoRe-PA.html | |
DNAsp | DNA多态性分析 http://www.ub.edu/dnasp/ | |
Genepop | 群体遗传学分析 https://genepop.curtin.edu.au/ | |
HGT-Finder | 水平基因转移发现 https://github.com/yinlabniu/HGT-Finder | |
IQ-TREE,IQ-TREE2 | 祖先重建 http 😕/www.iqtree.org/ | |
Jane | 共同进化研究 https://www.cs.hmc.edu/~hadas/jane/ | |
LSD | 系统发育树的时间校准 http 😕/www.atgc-montpellier.fr/LSD/ | |
Mesquite | 比较分析和统计 http://www.mesquiteproject.org/ | |
Ohnologs | 源自全基因组复制的脊椎动物同源基因数据库 http://ohnologs.curie.fr/ | |
PyCogent | 大量进化分析,包括分区模型和系统进化分析、树形图绘制和祖先重建 https 😕/github.com/pycogent/pycogent | |
RASP | 祖先重建 http://mnh.scu.edu.cn/soft/blog/RASP/index.html | |
SNiplay | SNP检测和其他群体遗传学分析 https://sniplay.southgreen.fr/cgi-bin/home.cgi | |
TimeTree | 系统发育树的剪切校准 http://www.timetree.org/ | |
TreeMap | 用于研究共同进化的软件 https://sites.google.com/site/cophylogeny/treemap |
蛋白质结构分析工具
Software | Features | |
---|---|---|
Alpha fold | 从氨基酸序列预测蛋白质结构 https://alphafold.ebi.ac.uk/ | |
FoRSA | 从氨基酸序列预测蛋白质结构 http://www.bo-protscience.fr/forsa/ | |
HHPred | 从氨基酸序列预测蛋白质结构 https://toolkit.tuebingen.mpg.de/tools/hhpred | |
I-TASSER | 从氨基酸序列预测蛋白质结构 https://zhanglab.dcmb.med.umich.edu/I-TASSER/ | |
PyMOL | 分子的三维可视化 http://www.mesquiteproject.org/ https://pymol.org/2/ |