一、人群SNV频率数据库
数据库名称 | 网站 | 简介 |
---|
dbSNP | https://www.ncbi.nlm.nih.gov/snp/ | dbSNP 包含人类单核苷酸变异、微卫星和小片段插入和缺失,以及常见变异和临床突变的发表、群体频率、分子结果以及基因组和 RefSeq 映射信息。 |
gnomAD | http://gnomad.broadinstitute.org/或http://www.gnomad-sg.org/ | gnomAD(v3.1.2)基于GRCh38,其中短变异(short variant)数据集涵盖了76,156个个体的全基因组测序数据,是各种疾病特异性研究和群体遗传研究的一部分。 |
1000Genomes | http://www.internationalgenome.org/ | 1000G旨在绘制当时(2012年)最为详尽、最有医学应用价值的人类基因组遗传多态性图谱。其后数据不断扩充,分析结果不断更新和迭代。目前已经有超过2500个人的基因组。2500个人的全部基因组可产生50 TB(5万 GB)的数据量,包含8万亿个DNA碱基对。 |
dbVar | http://www.ncbi.nlm.nih.gov/dbvar/ | dbVar由多种来源获得的基因结构变异 (通常>50 bp)信息组成。 |
ExAC | http://exac.broadinstitute.org/ | ExAC是gnomAD的前身,已被整合到gnomAD。 |
ESP | https://evs.gs.washington.edu/EVS/ | ESP 的目标是通过开创性地应用人类外显子组测序技术来发现导致心脏、肺和血液疾病的新基因和机制。 |
二、疾病数据库
数据库名称 | 网站 | 简介 |
---|
OMIM | https://omim.org/ | OMIM,即在线人类孟德尔遗传(Online Mendelian Inheritance in Man),是一个综合的、权威的研究人类表型和基因型关系的数据库,收录了所有已知的孟德尔疾病,和超过4532个基因包含影响表型的突变的信息。 |
HGMD | http://www.hgmd.org/ | 人类基因突变数据库 (HGMD) 代表了对所有已知(已发表)导致人类遗传疾病的基因病变进行整理。 |
Clinvar | https://www.ncbi.nlm.nih.gov/clinvar/ | ClinVar记录了人类变异和表型之间的关系,并提供了支持性证据。ClinVar提供的变异临床意义判读标准包含:pathogenic, likely pathogenic, uncertain significance, benign等。 |
ClinGen | https://www.clinicalgenome.org/ | ClinGen是美国国立卫生研究院(NIH)资助的数据库资源,用于精准医学,研究基因和变异的临床相关性。ClinGen提供了变异的剂量敏感性,有助于辨别突变的显隐性异常模式。更重要的是ClinGen结合临床、遗传模式、人群、功能证据及专家评审,根据ACMG/AMP指南对变异进行致病性分类,结果保存在ClinVar中。实验室和临床医生也可以使用ClinGen的”variant curation tools”来**评估尚未经过专家审查的变异致病性的证据。 |
SwissVar | https://web.expasy.org/ | SwissVar在2020年8月停止访问,数据整合到UniProt数据库 |
InterVar | https://wintervar.wglab.org/ | InterVar 用于根据 ACMG/AMP 2015 指南对遗传变异进行临床解释。InterVar 的输入是由 ANNOVAR 生成的带注释的文件,而 InterVar 的输出是将变异分类为’Benign’, ‘Likely benign’, ‘Uncertain significance’, ‘Likely pathogenic’ and ‘Pathogenic’,以及详细的证据。 |
三、表型数据库
数据库名称 | 网站 | 简介 |
---|
GeneReviews | http://www.genereviews.org/ | GeneReviews 是为忙碌的临床医生提供的国际即时护理资源,以标准化的期刊样式格式提供与遗传病相关的临床相关和医学上可操作的信息,涵盖患者及其家人的诊断、管理和遗传咨询。 |
中文版GeneReviews | https://genereviews.nrdrs.org.cn/paper/index | GeneReviews的中文版 |
HPO | https://hpo.jax.org/app/ | HPO数据库 提供了人类疾病中遇到的表型异常的标准化词汇表。HPO 目前包含超过 13,000 个术语和超过 156,000 个关于遗传性疾病的注释。 |
中文版HPO | https://www.chinahpo.net/ | HPO的中文版 |
四、序列数据库
数据库名称 | 网站 | 简介 |
---|
Genome | https://www.ncbi.nlm.nih.gov/genome/ | 人类全基因组参考序列的来源。 |
RefSeqGene | https://www.ncbi.nlm.nih.gov/refseq/rsg/ | 医学相关基因参考序列。 |
NCBI-Gene | https://www.ncbi.nlm.nih.gov/gene/ | Gene整合了来自广泛物种的信息。包括命名法、参考序列(RefSeqs)、图谱、通路、变异、表型等 |
LRG | http://www.lrg-sequence.org/ | LRG记录了包含稳定的参考序列,用于报告具有临床意义的序列变异 |
MitoMap | https://www.mitomap.org/MITOMAP/HumanMitoSeq/ | 对“剑桥版-人类线粒体DNA参考序列”进行修订后形成。 |
五、预测软件数据库
错义预测
数据库名称 | 网站 | 简介 |
---|
SIFT | http://sift.jcvi.org或http://sift-dna.org | 进化保守性 |
PolyPhen-2 | http://genetics.bwh.harvard.edu/pph2 | 蛋白结构/功能和进化保守性 |
CADD | http://cadd.gs.washington.edu | CADD结合等位基因的多态性,变异的致病性等多个因素,构建了一套模型,对每个变异位点进行评估,并给出一个具体的得分,简称C-Scores。统计模型直接给出的打分叫做RawScore。这个值越高,代表该变异位点是一个有害突变的概率越高。对RawScores进行从大到小排序,采用-10*log10(rank/total)的公式计算出scaled C-scores。由于这个公式和phread的定义方式类似,所以scaled C-scores也叫做PHREAD。CADD对多种变异有害性预测工具进行了整合(例如PolyPhen和SIFT),并对所有的变异类型都进行了打分 (不止包含错义突变)。 |
MutationTaster | http://www.mutationtaster.org | 蛋白结构/功能和进化保守性 |
Consurf | https://consurf.tau.ac.il/ | 进化保守性 |
FATHMM | http://fathmm.biocompute.org.uk | 进化保守性 |
MutationAsses | http://mutationassessor.org | 进化保守性 |
PANTHER | http://www.pantherdb.org/tools/csnpScoreForm.jsp | 进化保守性 |
PhD-SNP | http://snps.biofold.org/phd-snp/phd-snp.html | 进化保守性 |
SNP&GO | http://snps-and-go.biocomp.unibo.it/snps-and-go | 蛋白结构/功能 |
Align GVGD | http://agvgd.iarc.fr/ | 蛋白结构/功能和进化保守性 |
MAPP | http://mendel.stanford.edu/SidowLab/downloads/MAPP/index.html | 蛋白结构/功能和进化保守性 |
MutPred | http://mutpred.mutdb.org | 蛋白结构/功能和进化保守性 |
PROVEAN | http://provean.jcvi.org/index.php | 变异序列和蛋白序列同源性之间的相似性比对和测量 |
nsSNPAnalyzer | http://snpanalyzer.uthsc.edu | 多序列比对和蛋白结构分析 |
Condel | http://bg.upf.edu/fannsdb/ | 综合SIFT、PolyPhen-2和MutationAssessor进行综合预测 |
剪接位点预测
数据库名称 | 网站 | 简介 |
---|
GeneSplicer | http://www.cbcb.umd.edu/software/GeneSplicer/gene_spl.shtml | 马尔可夫模型 |
Human Splicing Finder | http://www.umd.be/HSF/ | 位置依赖的逻辑 |
MaxEntScan | http://hollywood.mit.edu/burgelab/maxent/Xmaxentscan_scoreseq.html | 最大熵原则 |
NetGene2 | http://www.cbs.dtu.dk/services/NetGene2/ | 神经网络 |
NNSplice | http://www.fruitfly.org/seq_tools/splice.html | 神经网络 |
FSPLICE | http://www.softberry.com/berry.phtml?topic=fsplice&group=programs&subgroup=gfind | 基于权重矩阵模型进行种特异性预测 |
核酸保守性预测
数据库名称 | 网站 | 简介 |
---|
GERP | http://mendel.stanford.edu/sidowlab/downloads/gerp/index.html | 基因组进化速率分析 |
PhastCons | http://compgen.bscb.cornell.edu/phast/ | 保守打分及鉴定保守元件 |
PhyloP | http://compgen.bscb.cornell.edu/phast/help-pages/phyloP.txt | 比对和分子进化树:在家系特异或者所有分支中,计算保守或者加速的P值 |
UCSC GenomeBrowser | http://genome.ucsc.edu/ | UCSC基因组浏览器可视化查看特定区域的保守信息 |
六、基因组拷贝数变异分析数据库
数据库名称 | 网站 | 简介 |
---|
DGV | http://dgv.tcag.ca/dgv/app/home | DGV的目标是提供人类基因组结构变异的综合总结。我们将结构变异定义为涉及大于 50bp 的 DNA 片段的基因组改变。数据库的内容仅代表在健康对照样本中识别到的结构变异。 |
ClinGen | https://www.clinicalgenome.org/ | ClinGen提供了部分CNV对照库。在自己没有CNV数据库 (In-house database)的情况下,可与ClinGen的公共CNV数据库比较 。 |
DECIPHER | https://www.deciphergenomics.org/ | 使用Ensemble基因组浏览器,将基因芯片数据和临床表型进行关联,便于临床医生和研究人员使用的细胞分子遗传学数据库。 |
UCSC Genome Browser | http://genome.ucsc.edu/ | 该网站包括广泛的脊椎动物和模型生物,以及一大套工具,用于查看,分析和下载数据。 |
七、其他数据库
数据库名称 | 网站 | 简介 |
---|
Pharmgkb | https://www.pharmgkb.org/ | PharmGKB是一个综合资源,为临床医生和研究人员管理有关基因变异对药物反应影响的知识。 |
Orphadata | http://www.orphadata.org/cgi-bin/index.php | Orphadata为科学界提供罕见疾病和孤儿药物相关的全面、高质量的数据集。 |
HGVS | http://www.hgvs.org/ | 本数据库由人类基因组变异协会 (HGVS)开发,提供数千种专门针对人群中的特殊变异进行的注释。 |
LOVD | http://www.lovd.nl | LOVD为基因组变异和表型收集、展示和管理提供灵活、免费的工具。 |
八、在线可视化平台
数据库名称 | 网站 | 简介 |
---|
ImageGP | http://www.ehbio.com/Cloud_Platform/front/ | 高颜值免费SCI图形绘制网站。 |
EVenn | http://www.ehbio.com/test/venn/ | 5种Venn图和Venn网络快捷在线绘制。 |
往期精品(点击图片直达文字对应教程)
机器学习
后台回复“生信宝典福利第一波”或点击阅读原文获取教程合集


