Ensembl突变数据描述之(一)——突变物种数据库及预测工具

 

  以下是对Ensembl突变数据库中储存的数据的描述,对于Ensembl数据库中不同的物种,我们从各种来源(例如,dbSNP数据库)导入突变数据(SNP、CNV、等位基因频率、基因型等),导入的突变数据和等位基因经过质量控制过程来标记可疑数据。

  我们将突变分成几个不同的类,并计算突变的预测结果,并且我们还创建了突变集以帮助人们从特定数据集中检索特定突变体组。

  我们计算了人类每个突变在种群中的连锁不平衡。

突变数据类型

Ensembl突变数据库储存了从外部导入的数据以及就算得来的数据。

外部导入的数据(dbSNP、Sanger、DGVa、…):

碱基突变(SNP、插入、缺失、…)

结构突变(拷贝数变异、串联重复、反转、…)

检测拷贝数的变化

碱基突变和结构突变的位置

等位基因

人群

基因型

表型(例如,人类中的青光眼。)

引文(摘自dbSNP数据库提交的信息,由EPMC和UCSC执行的文本挖掘)

计算数据(预测数据页面

储存突变数据的物种

Ensembl仅储存了以下23个物种的突变数据,但是用户依然可以在没有突变数据库的物种上使用Variant Effect Predictor VEP

 Short variantLong variantGenotypeAssociationPrediction
SpeciesSequence variant (e!91 → e!92) Source(s)Structural variantSamplePopulationPhenotypeCitationSIFTPolyPhen
Cat
Felis catus
 
3.6 million+-1 source------
Chicken
Gallus gallus
 
24 million+-1 source--
Chimpanzee
Pan troglodytes
 
1.6 million+-1 source-----
Cow
Bos taurus
 
104 million+-1 source-
Dog
Canis familiaris
 
5.9 million+(+148)1 source-
Fruitfly
Drosophila melanogaster
 
6.7 million+-1 source-----
Gibbon
Nomascus leucogenys
 
1.1 million+-1 source------
Goat
Capra hircus
 
37 million+ 1 source----
Horse
Equus caballus
 
21 million+(+16 million)1 source-
Human
Homo sapiens
 
329 million+(+350,000)6 sources
Macaque
Macaca mulatta
 
53 million+-1 source---
Mouse
Mus musculus
 
84 million+-1 source-
Opossum
Monodelphis domestica
 
1.1 million+-1 source-------
Orangutan
Pongo abelii
 
10 million+-1 source------
Pig
Sus scrofa
 
67 million+-3 sources-
Platypus
Ornithorhynchus anatinus
 
1.3 million+-1 source-----
Rat
Rattus norvegicus
 
5 million+-1 source--
S. cerevisiae
Saccharomyces cerevisiae
 
263,000+-1 source-----
Sheep
Ovis aries
 
61 million+-1 source-
Tetraodon
Tetraodon nigroviridis
 
902,000+-1 source-------
Turkey
Meleagris gallopavo
 
9,000+-1 source-----
Zebra Finch
Taeniopygia guttata
 
1.7 million+-1 source-----
Zebrafish
Danio rerio
 
17 million+-1 source-

列表中对应的Ensembl版本组装序列可以在这里找到。

大多数的突变信息是从NCBI dbSNP数据库中导入的,来自HapMap Project1000 Genomes Project等项目的数据是在提交给dbSNP数据库后即被导入。

Ensembl还包含其它来源的数据,可在浏览器配置查看这些来源的数据(例如,)。

# 突变信息展示

基因:突变表和突变图像。例如,KCNE2基因的所有突变

转录本:群体比较,比较突变图像(用于比较不同个体或菌株序列中转录本的突变)。例如,比较不同小鼠品系中的Tmco4

转录本:序列,蛋白质:蛋白质坐标中编码变体的列表。

物理位置:详细信息区域(可以使用左侧的“配置此页面”来绘制变体)菜单允许在Ensembl数据库中显示信息以及DAS格式的外部源,例如,DGV位点。)

表型:显示与某种表型相关的变体的核型视图,例如,青光眼

# 参考资料

Ensembl

转载于:https://www.cnblogs.com/yahengwang/p/9332595.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Ensembl数据库是一项生物信息学研究计划,旨在开发一种能够对真核生物基因组进行自动注释并维护的软件。它的基因数据集是根据mRNA和蛋白质序列的数据信息进行注释的,并且数据来源包括新的基因组数据、UniProt/SwissProt和UniProt/TrEMBL的蛋白质序列、NCBI的RefSeq中的DNA和蛋白质序列以及EMBL的cDNA序列。Ensembl是一个开源的基因注释软件系统,很多网站都采用Ensembl这套软件系统,并且它还拥有特有的BioMart功能,可以根据设定的条件对基因组进行检索并以图表形式呈现结果。此外,Ensembl还能与其他数据库整合,进行基因组间的比较分析。Ensembl数据库中储存了各种来源的突变数据,包括SNP、CNV、等位基因频率和基因型等,这些数据经过质量控制后被导入到数据库中。Ensembl是几个知名的基因组浏览器之一,用于检索基因组学信息,与NCBI Map Viewer和UCSC基因组浏览器相比,Ensembl的注释方式、数据来源和功能略有不同。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Ensembl数据库简介](https://blog.csdn.net/dingsheng56656/article/details/101889585)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [Ensembl突变数据描述之(一)——突变物种数据库预测工具](https://blog.csdn.net/weixin_30367543/article/details/99205142)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值