iDNA-ABF阅读笔记

最新推荐文章于 2024-07-17 16:15:51 发布

小张小张有学上

最新推荐文章于 2024-07-17 16:15:51 发布

阅读量118

点赞数

文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_52930699/article/details/129942676

版权

摘要

iDNA-ABF是一个多尺度的深度生物语言学习模型，能够仅基于基因组序列对DNA甲基化进行可解释的预测。

背景

5-甲基胞嘧啶(5mC)、N6-甲基腺苷(6 MA)和4-甲基胞嘧啶(4mC)是三种主要的DNA甲基化类型，根据核苷酸的类型、添加的分子类型和核苷酸内的修饰位置来命名。

将基因组序列视为“生物学文本”，并将不同尺度的顺序决定因子视为不同的“生物学词”。因此，我们提出了一种多尺度的生物语言学习模型——iDNA-ABF，成功地构建了从自然语言到生物语言的映射，以及从甲基化相关序列决定因素到它们的功能的映射。引入了一个经过大规模基因组序列预训练的模型来学习生物上下文语义，并提出了一种多尺度处理策略来从不同尺度捕获鉴别甲基化信息。我们进一步利用对抗训练和迁移学习来改善预测性能，增强模型的鲁棒性。模型通过探索基于注意机制的局部序列特征，在序列水平上提供了可解释的预测和分析。

AUC（Area Under Curve）被定义为ROC曲线下与坐标轴围成的面积，显然这个面积的数值不会大于1。又由于ROC曲线一般都处于y=x这条直线的上方，所以AUC的取值范围在0.5和1之间。AUC越接近1.0，检测方法真实性越高;等于0.5时，则真实性最低，无应用价值。

AP就是PR曲线与X轴围成的图形面积。

小张小张有学上

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
iDNA-ABF阅读笔记

iDNA-ABF是一个多尺度的深度生物语言学习模型，能够仅基于基因组序列对DNA甲基化进行可解释的预测。
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。