临床数据 1. 临床基因突变数据如何发高分?

bef0eb74e2bc80ccb5207f52bd487cc1.gif

桓峰基因公众号的粉丝中医学类科研偏多,因此对于临床数据的分析需求还是很多的,因此我们再次推出临床数据相关的一些文献以及对应的分析方法,那么临床数据大概哪几类呢?

临床信息

  1. 患者的个人信息包括性别、年龄、家族遗传史、吸烟史等疾病相关信息;

  2. 诊断信息包括临床分期、分组、分型、CT、病理图片、诊断书、化验单等信息;

  3. 临床治疗信息包括治疗评价、用药、PFS、症状等治疗相关信息;

  4. 基因检测信息包括不同时期的基因突变检测结果等;

  5. 以及涉及到治疗的相关信息;

  6. 最后就是随访信息包括生存状态和OS。

对于临床患者的研究来说,临床信息是非常重要的,所有的分析都将根据临床信息分组分型等进行操作,若有的老师攒了很多的患者样本想做个课题,一定是先做好临床信息的整理,这是非常重要的而且繁琐的工作,一旦课题有一定临床意义,是非常容易上分的,因此做好患者信息的整理起到事半功倍的效果。

今天我们就来看下若我们有临床信息,并且每个患者都做了基因检测,想对这些数据进行临床分析,我们该如何来做?

桓峰基因总结一些分析方向和方法,有感兴趣的老师可以参考,也可以直接联系我们进行分析,提供最优质的服务。

数据准备

1. 样本突变基因列表

样本突变基因列表,其中必须包括第一列样本编号,还有第一行基因ID,每个样本对应标记出来突变信息,从“样本编号”到第一个基因中间可以随意插入多列,文件格式如下:

9c3b3dc38ffeff7872db76b133c99c7e.png

2. 样本分组信息列表

样本分组信息列表,其中包括样本编号以及每个样本的分组信息,若某个样本在某个组内没有分组信息使用“NULL”代替,并且分组尽量利用英文代替,避免出现数学符号,例如:<、>等。组别利用英文单词代替,并且中间不要有空格,如需要两个单词之间利用“_”下划线链接,文件格式如下:

94e0b7223406dcacf02dafddea0dd22c.png

3. 基因Pathway注释列表

基因Pathway注释列表,其中包括pathwaygene,以及每个pathway所赋给的颜色(RGB之间使用;基因gene之间使用);pathwaygenepathway之间使用“\t”

09484d68ef56c91c83bedbcc8c6501d8.png

生信分析内容

1. 突变基因统计模块

计算每个基因突变的样本数量以及比例,同时利用不同颜色填充出具有相同pathway的基因。

2ac0ca4c5f7b879b43d06d63a974bf52.png

1 基因突变比例分布图

2. 突变基因展示模块

对基因以及样本排序后的矩阵直接做热图,红色表示样本在基因上有突变,如下图所示:

56092583186dd5e6099a7e7fa0cc598c.png

2 样本突变在不同基因上的分布图

3. 互作基因模块

对基因突变矩阵进行互作分析,得到成对互作基因,保留至少出现一次互作的基因,每条线表示一对相互作用的基因,线越粗表示互作基因在样本中出现的次数越高,作如下circos图:

46d1773523ddfd92a52aef4c779ffdbb.png

3 基因互作Circos

4. 整体互作分析模块

对基因突变矩阵进行互作分析,利用Fisher-test计算p-value,挑选p-value≤0.05的互作基因或互斥基因作图。色带表示OR值;圆点大小表示p-value;红色点表示倾向共存;蓝色点表示倾向互斥。

计算方法:

Tmin≥ 5N≥40时,用普通卡方检验公式;

1≤Tmin<5,用连续校正的卡方公式;

Tmin<1N<40时,用Fisher精确概率法。

fa3dcce542e8c2c073ee77b51f140a65.png

基因互作关系图

5. 组内互作分析模块

  1.  组内只有两类互作分析模块

根据3.2样本分组信息列表,对不同分组进行互作分析,例如按照血液病类型分组,可分为AMLMDS,计算其每个基因在两组的p-value以及or-value,挑选p-value≤0.05的基因作图,圆点大小表示p-value大小;横轴表示or-valuelog值,纵轴表示对p-valuelog,图上所有基因其p-value均小于0.05

a7476d1a6db893c64e769d9c468ec889.png

5 组内只有两类互作分析图

b.  组内多于两类互作分析模块

根据样本分组信息列表,对不同分组进行互作分析,例如按照FAB分组,可分为M0M1M2M4M5,计算M0与其他类型的p-value以及or-value,挑选p-value≤0.05的互作基因作图,右侧色带表示or-value,有显示出来方块表示其p-value均小于0.05

d0daed18c5f3b5c896e56061bc1ea69d.png

6 组内多于两类互作分析图

6. VAF分析

利用样本突变基因列表所给突变信息,在已测过的VCF注释文件中提取相应突变频率,横轴表示至少有一个样本检测到基因,纵轴表示突变频率,作如下箱图:

31c87c10bb9dfb3794baea2320360b34.png

7 突变基因的VAF分布图

7. 亚克隆分析

亚克隆分析矩阵,第一行表示时间(单位:天),矩阵表示每个时期的突变频率,如下表所示:

fd05a1adcddb60634e6b3a075c269bf2.png

关于克隆进化桓峰基因公众号有非常全面的生信分析教程可以参考,若觉得过于复杂可以联系我们提供分析服务。

0bd6de27f277ffa4ac4bd127895a245a.png

8 亚克隆Sankey

桓峰基因,铸造成功的您!

未来桓峰基因公众号将不间断的推出临床数据生信分析系列教程,

敬请期待!!

桓峰基因官网正式上线,请大家多多关注,还有很多不足之处,大家多多指正!

http://www.kyohogene.com/

桓峰基因和投必得合作,文章润色优惠85折,需要文章润色的老师可以直接到网站输入领取桓峰基因专属优惠券码:KYOHOGENE,然后上传,付款时选择桓峰基因优惠券即可享受85折优惠哦!https://www.topeditsci.com/

有想进生信交流群的老师可以扫最后一个二维码加微信

备注“单位+姓名+目的”!

beb921544091717dfb1a1cd62ec70c5c.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值