挑选基因对

老师给的第二种方法
现在你计算每一对计算A,B的基因依赖关系时,需要做的事情:(1)先将基因A在我们的数据是哪一行,B在我们的数据是哪一行定位出来(这个速度会比较慢,建议一次性一下子把所有的基因关系对定位出来,要不然速度会很慢,可以用ACCESS来做,当然,你也可以自己想办法处理)。(2)计算B与骨转移的互信息,对A的依赖值。(3)使用Permutation test计算这个依赖值的统计显著性(随机打乱A的值的循环1000次,得到1000个随机值,然后计算1000个随机值中有多少个值不比真实的依赖值小,这个个数/1000就是P-value)。将P-value<=0.05的关系对保留下来.(3)同理,计算A与表型对B的依赖。(4)把PPI中所有的显著关系对跑出来。

注意事项:(1)你可以通过实验观察(比如先做500对的基因,然后看当CMI为什么值的时候那个P-value一定不会小于0.05),当一个基因与表型的互信息,对另外一个基因的依赖值(CMI)小于某个值的时候,它其实就不可能会显著了,这种情况下,就不需要再做1000的随机打乱实验了,这样可以大幅提高计算效率,因为这个permutation test非常耗时间。(2)现在子所以没有像前面那样直接通过分布去估计P-value,是因为现在通过PPI缩小范围了,计算的时间上会大幅降低,所以可以用更精确的permutation test去计算P-value,这样结果更可靠

我的实验
1.用ACCESS处理了老师给的数据,把表中的基因定位到了乳腺癌基因ID的位置,一共有六十多万对基因。(文件是gene2.xlsx)。
2.计算A对B的CMI,跑出结果 。
3.挑选500对基因(这里取了前五百行,现在想了想觉得用随机五百对比较好),用置换检验计算p-value的值。
4.观察p-value和CMI,取了CMI大于0.0152的时候,p值小于0.05.
5.选出了geneId中CMI>0.0152的所有基因对。
6.同样做了B对A的CMI,选出了所有CMI>0.0152的基因对,并与A对B的基因对合并,一共有六万多行。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值