dbvar:染色体结构变异数据库

欢迎关注”生信修炼手册”!

染色体结构变异structural variation(SV), 被定义为1kb以上范围的DNA结构变化,通常包括缺失,重复,倒位,易位,当然也包含拷贝数变异(CNV), 染色体的结构变异来源于内因或者外因的作用,很多疾病就是由于染色体结构变异导致的,环境因素也可以诱导产生结构变异。

CMT是一种神经系统疾病,影响大脑和脊髓外的外周神经系统,主要表现为腿部肌肉萎缩,行走困难,可能出现足弓变高,足部畸形等症状,科学研究发现,该疾病与17号染色体上一段结构变异相关,示意如下

两个同源染色体的不平等交叉产生了两种基因型,基因型A包含了PMP22基因的3个拷贝,而基因型B包含了PM22基因的单拷贝,基因型A的个体就会发生CMT, 基因型B的个体则易感压力性麻痹HNPP。

dbvar数据库收录了来自多个研究项目的结构变异结构,网址如下

https://www.ncbi.nlm.nih.gov/dbvar/

在该数据库中,数据分为以下3个层级

  1. study,用std表示, 代表一个研究项目,该项目包含了一组结构变异分析结果,每个study有一个唯一的编号,如果来自NCBI,则以nstd开头,如果来自EBI,则以estd开头

  2. variant regions, 用sv表示,代表存在结构变异的基因组区域,同样有一个唯一的编号,如果来自NCBI,则以nsv开头,如果来自EBI,则以esv开头

  3. variant calls, 用ssv表示,代表一个具体的结构变异事件,包含了缺失,重复,CNV等多种类型,同样有一个唯一的编号,如果来自NCBI,则以nssv开头,如果来自EBI,则以essv开头

variant region与variant call的对应关系如下,一段染色体区域可以存在多个结构变异事件

通过Study Browser菜单,可以以study为单位查看相关的结构变异信息,示意如下

通过Genomes Browser菜单,可以在基因组浏览器中查看相关的结构变异信息,示意如下

该数据库是可以免费下载的,ftp地址如下

ftp://ftp.ncbi.nlm.nih.gov/pub/dbVar/data/Homo_sapiens/by_study

提供了VCF, CSV, TSV等多种格式,dbvar与来自EBI的DGVa是互作关系,共同提供了包含健康人类与患病人类的结构变异信息,而DGV数据库则只包含了健康人群的染色体结构变异信息。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值