人基因组重测序系列 - 3.遗传变异信息分析流程解析

遗传变异分析包括变异检测、基因注释、功能影响评估和疾病关联研究。SNV/INDEL的注释关注是否影响基因功能,CNV则考虑计量效应。疾病关联分析面临蛋白质结构功能变化鉴定、基因剂量效应和组织特异性影响的挑战。基因表达网络调控在解释罕见突变影响方面具有潜力。
摘要由CSDN通过智能技术生成

遗传变异信息分析流程解析

基于[Lappalainen T](Lappalainen T, Scott AJ, Brandt M, Hall IM. Genomic Analysis in the Age of Human Genome Sequencing. Cell. 2019;177(1):70-84. doi:10.1016/j.cell.2019.02.032)的整理,变异信息分析大致框架为 变异检测 -> 在基因组中对应的基因或调控元件 -> 涉及的功能 + 加疾病表型信息 - > GWAS关联分析 + 变异注释,最后整合所有结果并尝试阐释疾病发生的机制,提供一个合理的解释,为药物开发提供理论支持。常见的分析思路如下:

  1. 基于测序数据进行变异检测

  2. 变异信息分型+定相

  3. 变异注释,以及变异导致对基因行驶功能的影响

  4. 基于表型信息,与突变信息的关联分析,找到影响疾病发病的高可信突变

  5. 罕见突变分析(人群过滤)(低频有害)

在这里插入图片描述

人类基因组中含有大量的遗传突变或随机突变,常见的类型有SNV/INDEL/CNV/SV等。

在这里插入图片描述

但去阐释疾病大概会落脚到某一个通路或者基因上,所以对变异的功能注释便极为重要。

SNP与InDel注释

大致的工作流如下:

  1. 注释:使用Annovar中不同数据库对变异信息进行注释

  2. 基因区域注释:和参考基因组注释信息比较+注释库

  3. 突变导致功能注释:是否导致蛋白质结构或行驶功能异常

  4. 是否导致整个代谢链条中断或异常(计量效应,Aa)

在这里插入图片描述

结构变异注释

对于CNV及CNV的注释,更看重涉及片段的整个基因的计量效应,大致的工作流如下:

  1. 类型判断与注释

  2. 断点识别+CNVisi注释DUP/DEL

  3. 基因区域注释:使用Annovar中注释断点所在位点

  4. 突变导致功能注释:是否导致蛋白质结构或行驶功能异常

  5. 是否导致整个代谢链条中断或异常(计量效应,DUP/DEL)

在这里插入图片描述

疾病关联分析的现实挑战

  • 一个氨基酸的变化是否真正改变了蛋白质的结构和功能是非常困难的,尤其是剪切区域,不同的模型采用不同的策略

  • 基因剂量的影响方式甚至比蛋白质结构更多样化,转录和转录后调控都很复杂

  • 目前暂无法结合组织、细胞类型和细胞状态特异性信息进行分析,因为发育阶段和环境条件对特定基因的转录和翻译影响很大

  • 基因表达网络调控在未来是解释基因剂量效应或者突变解释的重要工具,尤其是罕见突变,但目前的信息不够全面

引用

  1. Lappalainen T, Scott AJ, Brandt M, Hall IM. Genomic Analysis in the Age of Human Genome Sequencing. Cell. 2019;177(1):70-84. doi:10.1016/j.cell.2019.02.032

  2. Nakagawa H, Fujita M. Whole genome sequencing analysis for cancer genomics and precision medicine. Cancer Sci. 2018;109(3):513-522. doi:10.1111/cas.13505
    ion medicine. Cancer Sci. 2018;109(3):513-522. doi:10.1111/cas.13505

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值