clinvar数据库(1)

遗传变异的数据库注释非常简单,就是从数据库里面下载记录文件,然后根据坐标对应一下即可,甚至很多成熟的工具都可以自动下载数据库以及比对,就跟我们前面讲到的把vcf文件注释到dbSNP数据库的ID一样简单。而clinvar的注释,可以寻找出对应的基因变异信息,发生频率,表型,临床意义,评审状态以及染色体位置等。
 

ClinVar是NCBI主办的与疾病相关的人类基因组变异数据库。它的强大在于整合了dbSNP、dbVar、Pubmed、OMIM等多个数据库在遗传变异和临床表型方面的数据信息,形成一个标准的、可信的遗传变异-临床相关的数据库。

数据库的详细说明,我就不赘述啦。http://www.biotrainee.com/thread-991-1-1.html (阅读原文即可)

打开那个文件,可以看到里面其实就是有dbSNP数据库的ID了,因为能被clinvar数据库收录的,必然已经在dbSNP数据库,稍微懂点脚本的都知道,完全没必要用软件来注释了,就把在clinvar数据库里面的rsID挑出来了即可。
如果你不懂如何写程序,那么就用annovar或者snpeff这样的傻瓜式软件吧,稍微看点说明书也很容易学会。必然annovar注释会挑出CLINSIG CLNDBN CLNACC CLNDSDB CLNDSDBID这些重要的记录,放在*dropped文件里面,打开看就可以啦。

比较重要的信息如下:

CLNSIG=1;
CLNACC=RCV000319204.1|RCV000371607.1;
CLNALLE=1;
CLNDBN=Benign_familial_neonatal_seizures|Benign_Neonatal_Epilepsy;
CLNDSDB=MedGen:Orphanet|MedGen;
CLNDSDBID=C2930911:ORPHA1949|CN239199;

其中CLNDSDB指示着该记录来源的数据库,因为clinvar也只是一个二次整合的数据库。CLNDSDBID记录着来源数据库的来源ID,CLNDBN比较重要,是描述疾病的。
最重要的就是CLNSIG,在数据库的头文件可以看到信息描述如下:

##INFO=<ID=CLNSIG,Number=.,Type=String,Description="Variant Clinical Significance, 0 - Uncertain significance, 1 - not provided, 2 - Benign, 3 - Likely benign, 4 - Likely pathogenic, 5 - Pathogenic, 6 - drug response, 7 - histocompatibility, 255 - other">

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值