筛选数据库_小白学数据挖掘:一文看懂如何用数据库筛选变异位点

本文介绍了在数据挖掘中筛选基因变异位点的方法,推荐了几个常用的数据库,如ensembl、1000Genomes、Clinvar等,并提供了使用示例。通过这些数据库,可以获取变异位点的注释信息、频率信息和临床意义,帮助理解基因与疾病的关系。
摘要由CSDN通过智能技术生成

2019年即将接近尾声了啦,又到了一年一度总结过去展望未来的关键时期。回望过去,看着年初的计划,小编发出灵魂三问:文章发表了吗?基因测序找安诺了吗?外显子数据库使用对了吗?

不晚,最好的开始时间就是现在,为了答谢广大客户长期以来对安诺优达的衷心支持,小编呕心沥血总结了一套最全的数据库使用教程,帮助大家在年底梳理数据,进一步筛选候选位点,迈向发paper的2020年。 快动下手指点赞收藏起来吧~

基因注释

推荐数据库:

refGene(https://www.ncbi.nlm.nih.gov/refseq/) Ensembl(http://asia.ensembl.org/index.html) UCSC(http://genome.ucsc.edu)

以ensembl数据库为例,在词条中输入要查询的变异位点、基因名称、位置信息或者rs号等,此处需要注意选择参考基因组版本号:hg38(GRCh38)/hg19(GRCh37)。

87ccff710bd774c67b77ef5c93e031f2.png

举个栗子,输入“rs9793256”,即出现如下界面:

8ebd25db81e545b7af2bd7c7786b0cc8.png

点击红框内容,可以看到有关该变异的注释信息,包括突变类型、突变频率、位置信息等。

a1851a47b4cfc52084bbd1763be3d7df.png

频率注释

推荐数据库:

1000Genomes(http://www.internationalgenome.org/)

ESP(http://evs.gs.washington.edu/EVS/)

ExAC(http://exac.broadinstitute.org/)

gnomAD(http://gnomad.broadinstitute.org/)

以ExAC数据库为例,在搜索词条里面,输入要检索的变异位点,或者关注的基因、变异区域等,按照词条下面提供的格式示例输入即可。

b2977ac0b9b62153ba904ca05d5e2ce6.png

举个栗子,输入“1- 1387764-G-A”即1号染色体,1387764位置上,由G突变成A的变异情况,提交即可看到该变异在各个数据库中的突变频率,也可以链接到UCSC、ClinVar数据库查看详细信息。

14a5237010ad26ef2825bd736a385508.png

功能注释

推荐数据库:

HGMD(http://www.hgmd.cf.ac.uk/ac/index.php)Clinvar(https://www.ncbi.nlm.nih.gov/clinvar/)

OMIM(https://omim.org/)

以Clinvar为例,在词条栏可以输入基因名、rs号等,也可以点击“Advanced”进行高级搜索。

dbbd89b0e2fda22ff1eb6e6c7465f0b2.png

举个栗子,输入“rs1051740”,数据库对该变异位点进行了星级打分,可以评估某个特定突变在疾病中的本来或者注释作用。临床意义:良性、可能良性、致病性等,且提供OMIM数据库链接、文献支撑等。

56cd31b1592cb3ad29f0cf69858a9a26.png

464f1cd805d9350211209debc2e9e7bf.png

ddb27b6c3567b86c60bee740dc0267df.png

疾病与表型的关系

Phenolyzer在线工具网址http://phenolyzer.wglab.org/,点击进入后会看到如下界面,按下述红色备注进行操作:

dfa8e8c257750502ce98c4a93d1e283e.png

所有选项填写完成后点击如上所述“Submit”按钮,在结果中的任意节点可以用鼠标进行拖拽移动节点位置,图片下方可以根据自己的需要选择是否显示某些信息(基因、疾病……),以及互作连线的方式(蛋白互作、同属一个家族……)。

749322a982d15561feca4aa3adcff4e5.png

点击“Barplot”按钮,可将候选基因与该疾病/表型的相关性进行打分,基因排序越靠前代表与疾病/表型相关性越高,具体结果如下所示:

41c0480be913b0b82cad010ed34d4916.png

以上就是小编整理的关于变异位点筛选中经常用到的数据库,当然上述数据库的功能绝不仅限于此,感兴趣的小伙伴们可以自行进行数据挖掘,欢迎大家随时交流沟通~

安诺基因搭建多样化的人基因组测序平台,为遗传性疾病的研究提供优质、高效的高通量测序服务。

●自动化建库平台:实现DNA小片段文库、外显子捕获文库的自动化建库,单次建库通量96个样品,大幅缩短实验周期。

●安诺云大数据分析平台:拥有全面的基因组学分析流程,数据分析快速高效,快速分析周期1天内完成。

●中国人群基因组数据库:打造中国人自己的基因组数据库——Annoroad Typical Chinese Genomes(ATCG)数据库,辅助深入挖掘中国人群特有变异,助力中国疾病研究。

●多组学联合分析流程:更高效地利用基因组、转录组及表观组三大组学数据,全面揭示疾病致病机制,助力生物标志物挖掘。

●丰富的医学临床转化经验:具有多种IVD产品的临床转化经验,曾参与合作项目临床试验成果的专利申报及产品转化。

文案:产品经理 蔡可

c27ed1c6ae9649e1fa263e7b86e3d7f2.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值