作者,Evil Genius
在做肿瘤特检报告的时候,经常会出现像针对基因的mutation、针对外显子的插入缺失,比如EGFR Exon 19 Deletion等,但还有像BRAF V600这种情况,那么像V600是不是就是针对V600变成什么氨基酸都算呢?
在整理COSMIC临床药物的时候发现了这个现象
也就是像F1174这样的随便突变成什么氨基酸的做法,会标注F1174X,但是有些像G1202的突变,就是指具体的几个突变类型。
说回到我们的V600,如下图
也是指特定的几种氨基酸类型的突变。
看来很多事情都有背后的逻辑,并不是我们想的那样,那么我们该如何确定这种突变的范围呢?
像FDA、NCCN等指南当然就要查文献了,有的数据库会标注,比如COSMIC,当然还有很多其他情况,就需要cancer hotspot数据库了,官网在Cancer Hotspots
提供在大规模癌症基因组学数据中发现的具有统计学意义的复发性突变的信息。
这个hotspot的数据库可以直接下载
包含的信息就有
Hugo_Symbol
Amino_Acid_Position
log10_pvalue
Mutation_Count
Reference_Amino_Acid
Total_Mutations_in_Gene
Median_Allele_Freq_Rank
Allele_Freq_Rank
Variant_Amino_Acid
Codon_Change
Genomic_Position
Detailed_Cancer_Types
Organ_Types
Tri-nucleotides
Mutability mu_protein
Total_Samples
Analysis_Type qvalue
tm
qvalue_pancan
Is_repeat seq
length
align100
pad12entropy
pad24entropy
pad36entropy
TP
reason
n_MSK
n_Retro
judgement
inNBT
inOncokb ref
qvaluect
ct
Samples