Time course gene analysis--lmms 算法总结

总结一下lmms 算法,来着论文‘A Linear Mixed Model Spline Framework for
Analysing Time Course ‘Omics’ Data’。

lmms 提供了一整套处理Time Course ‘Omics’ Data’的流程,包括quality control and filtering, modeling, clustering and differentila analysis.

Filtering

首先重点是: 这个方法是建立在我们的数据是包含:
n个样本, 第i个样本重复mi次,都被测了T个时间点的基础上。

lmms首先计算了3个平均标准差(SD)
1, 每个时间点在所有样本上的平均SDyi(t)表示样本i在时间t上的表达量
2, 每一个样本在所有时间点上的平均SD
在这里插入图片描述
3, 整体标准差
在这里插入图片描述
其中,yi(t)表示样本i在时间t上的表达量

然后计算两个filter ratios:
在这里插入图片描述
我们希望RT 和 RI 越小越好。所以就可以把RT和RI 大的gene过滤掉

modeling

这一步主要是用 p-spline拟合数据。
首先,最简单的方式,我们可以对每个时间点,像limma一样建立一个线性模型,
在这里插入图片描述
或者用 penalized spline 建立一个非线性模型:
在这里插入图片描述
在这里插入图片描述
这一步,其实是在T内选择了k个时间点,然后拟合一个分段函数,不是曲线。
接下来,讨论更复杂一点的情况。 作者添加了一个变量Ui, 去估计每个样本每次重复的结果的变化
在这里插入图片描述
最后作者提出DLMMS, 其实就是对公式3求导
在这里插入图片描述

clustering

经过模型的拟合,我们得到了新的时间序列矩阵(Lmms)或者它的导数矩阵(dlmms),然后就能用任何方法聚类了。

这个方法似乎对非线性时间间隔不太友好

Straube J, Gorse AD; PROOF Centre of Excellence Team, Huang BE, Lê Cao KA. A Linear Mixed Model Spline Framework for Analysing Time Course ‘Omics’ Data. PLoS One. 2015 Aug 27;10(8):e0134540. doi: 10.1371/journal.pone.0134540. PMID: 26313144; PMCID: PMC4551847.

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值