clinvar数据库（1）

最新推荐文章于 2024-04-26 15:58:24 发布

doovin

最新推荐文章于 2024-04-26 15:58:24 发布

阅读量842

点赞数

文章标签：经验分享

原文链接：https://www.csdn.net/tags/MtTaEg0sMzk1MDktYmxvZwO0O0OO0O0O.html

版权

遗传变异的数据库注释非常简单，就是从数据库里面下载记录文件，然后根据坐标对应一下即可，甚至很多成熟的工具都可以自动下载数据库以及比对，就跟我们前面讲到的把vcf文件注释到dbSNP数据库的ID一样简单。而clinvar的注释，可以寻找出对应的基因变异信息，发生频率，表型，临床意义，评审状态以及染色体位置等。

ClinVar是NCBI主办的与疾病相关的人类基因组变异数据库。它的强大在于整合了dbSNP、dbVar、Pubmed、OMIM等多个数据库在遗传变异和临床表型方面的数据信息，形成一个标准的、可信的遗传变异-临床相关的数据库。

数据库的详细说明，我就不赘述啦。http://www.biotrainee.com/thread-991-1-1.html (阅读原文即可)

打开那个文件，可以看到里面其实就是有dbSNP数据库的ID了，因为能被clinvar数据库收录的，必然已经在dbSNP数据库，稍微懂点脚本的都知道，完全没必要用软件来注释了，就把在clinvar数据库里面的rsID挑出来了即可。
如果你不懂如何写程序，那么就用annovar或者snpeff这样的傻瓜式软件吧，稍微看点说明书也很容易学会。必然annovar注释会挑出CLINSIG CLNDBN CLNACC CLNDSDB CLNDSDBID这些重要的记录，放在*dropped文件里面，打开看就可以啦。

比较重要的信息如下：

CLNSIG=1;
CLNACC=RCV000319204.1|RCV000371607.1;
CLNALLE=1;
CLNDBN=Benign_familial_neonatal_seizures|Benign_Neonatal_Epilepsy;
CLNDSDB=MedGen:Orphanet|MedGen;
CLNDSDBID=C2930911:ORPHA1949|CN239199;

其中CLNDSDB指示着该记录来源的数据库，因为clinvar也只是一个二次整合的数据库。CLNDSDBID记录着来源数据库的来源ID，CLNDBN比较重要，是描述疾病的。
最重要的就是CLNSIG，在数据库的头文件可以看到信息描述如下：

##INFO=<ID=CLNSIG,Number=.,Type=String,Description="Variant Clinical Significance, 0 - Uncertain significance, 1 - not provided, 2 - Benign, 3 - Likely benign, 4 - Likely pathogenic, 5 - Pathogenic, 6 - drug response, 7 - histocompatibility, 255 - other">

doovin

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
clinvar数据库（1）

遗传变异的数据库注释非常简单，就是从数据库里面下载记录文件，然后根据坐标对应一下即可，甚至很多成熟的工具都可以自动下载数据库以及比对，就跟我们前面讲到的把vcf文件注释到dbSNP数据库的ID一样简单。打开那个文件，可以看到里面其实就是有dbSNP数据库的ID了，因为能被clinvar数据库收录的，必然已经在dbSNP数据库，稍微懂点脚本的都知道，完全没必要用软件来注释了，就把在clinvar数据库里面的rsID挑出来了即可。ClinVar是NCBI主办的与疾病相关的人类基因组变异数据库。...
复制链接

扫一扫