原文链接
一、非编码(指的是非蛋白编码)点突变概况
a. 常见的点突变基因及突变位点
CNS-GBM为例
TERT基因(5号染色体,起始位置1295228,20个样本),至突变因素 不明(other)> 紫外线(UV)> 年龄 > 胞嘧啶脱氨酶(APOBEC)
TP53基因(17号染色体,起始位置7577120,1个样本),至突变因素 年龄 > 不明(other)
TERT基因(5号染色体,起始位置1295250,6个样本),至突变因素 紫外线(UV)> 不明(other)> 年龄 > 胞嘧啶脱氨酶(APOBEC)
TP53基因(17号染色体,起始位置7577538,2个样本),至突变因素 年龄 > 不明(other)
IDH1基因(2号染色体,起始位置209113112,3个样本),至突变因素 年龄 > 不明(other)
b. 非编码点突变基因及突变位点
CNS-GBM,TERT蛋白编码区点突变
卵巢腺癌,POLR3E蛋白编码区点突变,RP11-440L14.1长链非编码RNA(lncRNA)启动子点突变+少量结构突变
二、新发现的非编码区突变
a. TOB1基因3’非编码区(非翻译区,Untranslated Regions,UTR)点突变及结构突变
b.TP53基因5’UTP区结构突变(多)及点突变
c. ALB,NEAT1,MALAT1等基因突变概况(未包含AID相关肿瘤)
d. e. 上述基因3’UTP区结构突变较为常见;插入缺失基因长度大多在2-5 bp;
f. 下游1-kb区,3’UTP,内含子(Introns),外显子(Exons),5’UTP 及上游1-kb区点突变(SNV)及结构突变(Indel)发生率
三、反复断点及反复并置区
a. CNS-GBM CDKN2A基因出现反复断点
b.根据基因重排分散分数及平均复制时间将突变基因分类
紫色,基因融合为主
体细胞拷贝数变异(SCNA)为主,包括:红色,基因扩增;蓝色,基因缺失;黑色,拷贝数无变化
绿色,基因碎裂
c. d. e. 乳腺癌及卵巢癌突变情况,其中无基因结构突变(SV-)的占多数,但其基因表达数明显升高(过表达)
f. 30个主要的存在反复断点及反复并置区(SRJ)基因
CNS-GBM 涉及EGFR基因
g. 与基因过表达相关,存在反复断点及反复并置区的突变基因,部分记录于体细胞突变目录(COSMIC,紫色),部分未记录于(COSMIC,新发现)
小部分基因(灰色)与基因过表达相关,但不存在反复断点及反复并置区
h. i. 黑色素瘤TERT基因启动子突变情况
四、统计效能
a. b. 方框中数字为,未发现突变的患者数,蓝色到红色,效能变差
CNS-GBM(黄色)统计效能约80%以下,而胰腺癌(蓝色)效能最高(95%以上)
c. 由于基因反复并置(SRJ)发生率低,低发生区效能好于高发生区(以SRJ 12%为界)
d. cis调节、编码区突变突变数,蛋白质编码区(CDS)> 3’UTP > 启动子 > 5’UTP
--------------------华丽的分割--------------------