欢迎关注公众号:oddxix
如果觉得写的不错记得点个赞哦!
留步看一下这个讲解视频吧~~
https://v.qq.com/x/page/m03789y9j98.html
搭配这个pdf食用更佳哦~
https://www.clinicalgenome.org/site/assets/files/1594/landrum_clinvar.pdf
1.简介
网址https://www.ncbi.nlm.nih.gov/clinvar
ClinVar是NCBI主办的与疾病相关的人类基因组变异数据库。它的强大在于整合了dbSNP、dbVar、Pubmed、OMIM等多个数据库在遗传变异和临床表型方面的数据信息,形成一个标准的、可信的遗传变异-临床相关的数据库。ClinVar同时支持在线和下载到本地两种形式。
clinvar是一个开放的数据库,每个研究机构都可以向其提交数据,对于提交的信息,会有专家团队进行审核评级。对于数据库中的位点,根据注释信息的可靠性,分成了1到4个不同的星级,星级越高,可信度越高。截至到2018年11月12日,数据库中所有记录统计如下:
clinvar主要整合以下四块信息:
ClinVar 采用的是星标系统(star-based system),可以评估某个特定突变在疾病中的本来或者注释作用。四星级是最高级,指这个突变的功能已经经过了多位专家的测评。这样详细审查过程的好处在于用户能信任三、四星突变的功能注释,但是在ClinVar 数据库中只有少量此类数据(3800个)。更多时候是只有一星的突变,这通常只基于单个提出注释功能的研究成果,还有没有星的,也就是提交者没有提供解释标准和支持证据。ClinVar 工具的一个问题在于其数据库中大多数临床上重要的突变(83%)都是某个家庭中独一无二的,或者非常罕见的。
2.在线搜索
搜索方式可以分为简单搜索和高级搜索。在该数据库中,提供了以下7种检索方式
- gene symbols
- HGVS expressions
- protein change
- rs number
- disease
- submitters
- location on a chromosome
以PTEN
这个gene symbol为例,检索出的部分记录如下:
从结果中,我们可以获知这个基因多种信息,其中有: - 1.总体信息:在左侧栏目找到这个关键词的总体统计信息,同时这些信息也可以作为筛选条件而使用。
- 2.变异和位置信息:可以发现基因的变异位置、变异类型(C>T还是其他)、所在染色体信息等。
- 3.与其相关的疾病。
- 4.变异频率:这个minor变异类型在不同数据库中的出现频率,如GO-ESP:0.00054(T)表示在ESP数据中含有“T”的等位基因频率为0.00054。
- 5.临床意义:可以简单理解为这个突变对临床疾病的重要性。分为pathogenic(致病),likely benign(可能有害)等多个等级。
- 6.审核状态:因为这些临床意义是提交者自己定义并且提交的,因此有可能会对数据有一定误导作用,通过对数据的审核,有助于加强数据的可靠性。但不是每个数据都会有审核。
2.1 Interpretation
这部分会给出突变位点的临床意义Clin