论文剖析
热门论文:
AgeGuess,一种预测人类年龄的甲基化模型
///
1. 介绍
衰老是一个生物过程,受到遗传因子和细胞内各种分子修饰的影响。多项研究表明,使用甲基组数据可以准确预测实际年龄。本篇文章针对年龄回归问题,提出了一种三步特征选择算法。AgeGuess选择了107个甲基化特征作为性别独立的年龄生物标志物,使用这些生物标志物的支持向量回归模型(SVR)预测的年龄与实际年龄的平均绝对偏差(MAD)达到2.0267。性别独立的年龄预测模型可以通过建立两个性别特异性模型来进一步完善。
2. 介绍
衰老是几乎所有多细胞生物普遍存在的现象。越来越多的证据表明,衰老是一个严格受表观遗传修饰调控的生物过程,而不是随机事件。DNA甲基化被认为参与了各种与年龄相关的生物学过程。DNA甲基化是在DNA甲基转移酶的促进下选择性地将一个甲基添加到胞嘧啶中形成5胞嘧啶的生物学过程。这种表观遗传修饰在转录调控等生物过程中发挥着至关重要的作用。
特征选择算法在许多生物医学研究领域得到了应用。特征选择算法可以显著降低模型复杂度和过拟合的可能性。特征选择不仅广泛应用于基因的生物信息学问题、蛋白质,和新陈代谢系统,而且在生物医学图像分析和时间序列数据也发挥了重要作用。
本研究提出了一个三步特征选择算法,AgeGuess,使用甲基组谱以找到最佳年龄预测生物标志物。指标的最大信息系数(MIC)是一个敏感的相关测量,用于去除那些MIC与年龄相关性较小的甲基体特征。剩余的特征基于支持向量回归的评价被递归消除。最后一步基于彻底筛选,迭代