Indel (Insertion and Deletion)分析简介

Indel (Insertion and Deletion)分析简介

InDel 简介
InDel 是指基因组中小片段的插入或缺失序列,其长度在 1-50bp 之间。原因在于Illumina测序的reads(读长)大小为100bp左右,包括单端测序(single-end, 100bp),双端测序(paired-end,2 x 100bp)两种。因此在序列比对SNP calling时,能够检测到的可靠的Indel大多小于100bp,通常最大在50bp左右。 Small InDel 变异一般比SNP 变异少,同样反映了样品与参考基因组之间的差异,编码区的 InDel 会引起移码突变,导致基因功能的变化。

原始数据可以由不同的平台产生:如Illumina (NovaSeq),PacBio (CCS)等。此外,常用的InDel 检测分析软件:GATK ,samtools,TASSEL。
运用不同的variant caller或者training model进行indel分析,如DeepVariant (CCS model),DeepVariant (Illumina model),DeepVariant (haplotypesorted CCS model),GATK HaplotypeCaller (no filter),GATK HaplotypeCaller (hard filter)

用GATK对RNA-seq做数据做 INDEL分析流程:

  1. 用STAR软件将数据比对到参考基因组(mapping to the reference)。
  2. 用picard的markduplicates命令进行data cleanup。
  3. 用GATK的SplitNCigarReads包处理cigar里含有N的reads。
  4. 碱基质量分数重校准(Base Quality Recalibration),就是利用机器学习的方式调整原始碱基的质量分数。
  5. Variant Calling,Filtering和Annotation。
  • 8
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
突变特征分析(signature)是基因组学研究中常用的一种分析方法,用于研究突变的类型、频率和模式。它通过分析基因组或肿瘤样本中的突变模式来寻找潜在的致病机制或者揭示特定环境或药物对基因组的影响。 突变特征分析signature通常涉及以下几个方面的研究内容: 1. 突变类型:通过分析各种突变类型,如单核苷酸变异(Single Nucleotide Variant, SNV)、小片段插入缺失(Insertion/Deletion, Indel)、基因重排等,来了解不同突变类型在不同疾病或环境中的影响。 2. 突变频率:通过分析不同突变的频率,即它们在样本中的出现频次,来了解突变在族群或个体中的普遍程度和变异情况。 3. 突变模式:通过研究突变在基因组中的分布模式,如插入或缺失突变集中在某些特定区域等,来了解突变的发生机制和可能的致病途径。 4. 签名解读:通过将突变特征与文献数据库进行比较和解读,寻找与特定生物学过程、突变机制或环境暴露相关的“签名”特征。这些“签名”特征可以帮助我们理解肿瘤的发生发展过程,或者预测特定药物治疗的疗效。 通过突变特征分析signature,我们可以更深入地了解突变的重要性和意义,揭示致病机制,并为精准医学的发展和个体化治疗提供有效的依据。未来,随着技术的进一步发展,突变特征分析signature将在疾病预测、治疗选择和生物学研究等方面发挥更大的作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值