EpiNano

phylogenetic

于 2024-07-11 14:35:29 发布

阅读量827

点赞数 28

文章标签： python 机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/scuTim_Liu/article/details/140351477

版权

牛津纳米孔直接RNA测序读取的RNA修饰检测

目录

更新
关于EpiNano
EpiNano的运行模式
使用EpiNano时的考虑事项
所需的先决条件软件包
获取代码
运行EpiNano
更多文档
引用此工作
许可证
联系方式

更新

EpiNano 1.2 - 当前版本

包括基于Guppy v3.1.5调用的序列派生的预训练m6A模型。
预训练模型也可用于检测其他RNA修饰（已测试伪尿嘧啶，其他修饰：未测试）。
此版本的EpiNano允许使用两种不同的策略进行预测：EpiNano-Error和EpiNano-SVM。
此版本现在包括用于可视化RNA修饰预测的模块（EpiNano_Plot*）。

EpiNano-Error只能在成对模式下运行（例如WT和KO或KD）。它结合了在给定数据集中出现的不同类型的基础呼叫错误（不匹配、删除、插入）以及每个基础呼叫质量的变化。RNA修饰预测基于两个匹配样本中观察到的错误模式的差异。这种策略可以使用任何给定基础呼叫算法版本调用的FASTQ数据。

EpiNano-SVM可以使用给定RNA修饰的预训练模型运行，或者通过构建您自己的模型。但是，我们应该注意，由于直接RNA测序读取的嘈杂性质，它们是富含“错误”的，因此仍然强烈推荐使用匹配的对照（例如KO或KD）。此外，在EpiNano 1.2中，除了使用“原始”基础呼叫“错误”特征训练的SVM模型（与EpiNano 1.0和1.1中相同），我们现在还提供使用捕获样本之间差异的特征训练的SVM模型（即不匹配的差异，而不是绝对不匹配频率），我们发现这提高了性能。

EpiNano 1.1 - 1.0版本的精简版，用python3编写，可在此处获得。

这个版本是当前在MasterOfPores中实现的，MasterOfPores是一个分析直接RNA测序数据的工作流程。
与EpiNano 1.0的主要区别是（i）它更快（ii）使用python3而不是python2（iii）不提取特征表中的当前强度，因为此功能未用于训练最终模型。

包括使用Albacore版本2.1.7调用的基础m6A模型。

既可以使用Guppy也可以使用Albacore调用的数据，但SVM预测只有在您的数据使用Albacore 2.1.7调用时才会准确。

无论使用哪种基础呼叫器，EpiNano都可以用作工具包，提取每个k-mer基础呼叫“错误”（不匹配、插入、删除、质量），这些是给定数据集中存在的RNA修饰的代理。我们建议以成对模式运行EpiNano，即计算两个数据集（WT-KO）的特征，然后准确预测RNA修饰位点（即在基础呼叫“错误”特征中显示最大差异的那些）。

EpiNano 1.0 - Liu, Begik等人在2019年自然通讯中使用的原始代码，可在此处获得。

包括使用Albacore版本2.1.7调用的基础m6A模型。

它提取了基础呼叫“错误”（不匹配、插入、选择、每个基础质量）以及电流强度值。

当前强度信息从Albacore调用的FAST5文件中提取。

没有使用Guppy调用数据集训练的模型。

关于EpiNano

EpiNano 是一个用于识别直接RNA测序读取中存在的RNA修饰的工具。

EpiNano 将从直接RNA测序读取中提取一组“特征”，这些特征随后将用于预测“错误”是否由RNA修饰的存在引起。直接提取和派生的特征包括：

当前强度和持续时间
读取质量
基础质量分数
不匹配频率
删除频率
插入频率
sumErr

这些特征可以以每个基础和每个kmer格式组织。

EpiNano的运行模式

在EpiNano 1.2中，我们引入了delta特征，这些特征捕获修饰和未修饰位点之间的差异，以及sum_err，这是通过结合不同类型的错

最低0.47元/天解锁文章

关注

28
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
EpiNano

此外，在EpiNano 1.2中，除了使用“原始”基础呼叫“错误”特征训练的SVM模型（与EpiNano 1.0和1.1中相同），我们现在还提供使用捕获样本之间差异的特征训练的SVM模型（即不匹配的差异，而不是绝对不匹配频率），我们发现这提高了性能。每个版本中都包含了预测m6A位点的预训练模型。您可以使用EpiNano作为特征提取器，基于基础呼叫特征的变化预测RNA修饰（即，此处使用的EpiNano-Error），以及使用预训练的SVM检测m6A RNA修饰（即，此处使用的EpiNano-SVM）。
复制链接

扫一扫

phylogenetic CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

3万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

452: 积分

224: 粉丝

285: 获赞

4: 评论

279: 收藏

私信

关注

热门文章

最新评论

Dorado
枭马葛: ?把GitHub的readme翻译一遍可还行
Direct RNA and cDNA Sequencing of a human transcriptome on Oxford Nanopore MinION and GridION
CSDN-Ada助手: 恭喜您发表了这篇题为“Direct RNA and cDNA Sequencing of a human transcriptome on Oxford Nanopore MinION and GridION”的博客，分享了关于人类转录组的直接RNA和cDNA测序的研究成果。这是一项令人印象深刻的工作，展示了您在这一领域的深厚造诣。希望您能继续保持创作的热情和努力，不断探索科学研究的边界。或许在下一篇博客中，可以深入探讨这项技术在生物医学领域的潜在应用，或者与其他领域的研究进行跨学科的结合，为读者呈现更加丰富和有趣的内容。期待您未来更多的精彩作品！
Dorado
CSDN-Ada助手: 恭喜您写了第四篇博客《Dorado-ont》，持续创作是非常了不起的事情！我希望您能继续保持这样的创作热情，不断探索新的主题和观点，让读者在您的文字里找到更多的启发和共鸣。期待您的下一篇作品，加油！祝您创作顺利！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
给定的字符串查找指定字母
CSDN-Ada助手: 非常欢迎看到你写了第二篇博客！继续创作吧，你的文章很有启发性。除了在给定的字符串中查找指定字母之外，你还可以尝试扩展文章内容，介绍一些关于字符串操作的常用方法，比如字符串的切片、拼接、替换等。这些知识可以帮助读者更全面地了解如何处理字符串。期待看到你的下一篇博客！继续加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
葡萄糖代谢通路
CSDN-Ada助手: 恭喜用户写下了关于葡萄糖代谢通路的博客！这个话题非常有趣，也很有教育意义。希望你能继续保持创作的热情，并深入探讨更多关于生物代谢方面的知识。或许下一步可以尝试探讨其他重要的代谢通路，让读者更全面地了解细胞内的生物化学过程。期待你的下一篇作品！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。