mysql性能探针_用R和mysql把基因对应的最大表达量探针挑出来

懂点芯片数据分析的都应该知道,芯片设计的时候,对一个基因设计了多个探针,这样设计是为了更好的捕获某些难以发现的基因,或者重点研究某些基因。

但是对我们的差异分析不方便,所以我们只分析哪些有对应了entrez ID的探针,而且对每个entrez ID,我们只需要挑选它表达量最高的那个探针。

所以就演化为一个编程问题:分组求最大值,多公共列合并!

如果是在R语言里面,那么首先这个table的表示形式如下

> esetDataTable[1:10,c(7,8)]

EGID rowMeans

1000_at 5595 1840.04259751826

1001_at 7075 799.075414422572

1002_f_at 1557 50.4884096416177

1003_s_at 643 142.372008051308

1004_at 643 211.65300963049

1005_at 1843 4281.29318032004

1006_at 4319 38.5784289213085

1007_s_at NA 1489.98158531843

1008_f_at 5610 4013.576753977

1009_at 3094 3070.50648167305

我们首先看看一个R语言函数处理方式吧,这个是比较容易想到的算法,但是用到了循环,非常的不经济,计算量很大。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值