第三代PacBio长read纠错方法

最新推荐文章于 2024-05-10 20:47:17 发布

wangchuang2017

最新推荐文章于 2024-05-10 20:47:17 发布

阅读量57

点赞数

文章标签：人工智能深度学习神经网络

本文链接：https://blog.csdn.net/u010608296/article/details/130773697

版权

正在为您搜索：第三代PacBio长read纠错方法

目前PacBio长read纠错方法可以分为以下几类：

1. 基于互补信息的纠错方法：利用长read和其互补序列之间的互补性质，比如Proovread [[1](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4251470/)]和LoRDEC [[2](https://academic.oup.com/bioinformatics/article/32/17/i521/2450448)]。

2. 基于重叠图的纠错方法：通过构建长read的重叠图进行纠错，比较知名的有FALCON-unzip [[3](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0213266)]、HiCanu [[4](https://github.com/hirak/HiCanu)]和Racon [[5](https://academic.oup.com/bioinformatics/article/33/13/i319/3953959)]等。

3. 基于深度学习的纠错方法：使用深度学习算法对长read进行纠错，比如DeepEC [[6](https://www.biorxiv.org/content/10.1101/2020.02.19.958376v2.full.pdf)]和DeepMHC [[7](https://www.biorxiv.org/content/10.1101/2021.02.16.431995v1.full.pdf)]。

4. 基于信号的纠错方法：利用PacBio长read的原始测序信号来进行纠错，比如DeepSignal [[8](https://www.biorxiv.org/content/10.1101/2021.04.18.440919v1.full.pdf)]和SignalAlign2 [[9](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7048421/)]。

5. 基于文本处理的纠错方法：将长read转化为文本序列，使用NLP技术进行纠错，比如DeepTrio [[10](https://www.biorxiv.org/content/10.1101/2020.04.11.036418v1.full.pdf)]。参考文献： [[1](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4251470/)]：Hackl, T., Hedrich, R., Schultz, J., & Förster, F. (2014). Proovread: large-scale high-accuracy pacbio correction through iterative short read consensus. Bioinformatics, 30(21), 3004-3011. [[2](https://academic.oup.com/bioinformatics/article/32/17/i521/2450448)]：Salmela, L., & Rivals, E. (2016). LoRDEC: accurate and efficient long read error correction. Bioinformatics, 32(17), i521-i527. [[3](https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0213266)]：Chin, C. S., Peluso, P., Sedlazeck, F. J., Nattestad, M., Concepcion, G. T., Clum, A., ... & Korlach, J. (2019). Phased diploid genome assembly with single-molecule real-time sequencing. PLoS One, 14(4), e0213066. [[4](https://github.com/hirak/HiCanu)]：Koren, S., Walenz, B. P., Berlin, K., Miller, J. R., & Phillippy, A. M. (2017). Canu: scalable and accurate long-read assembly via adaptive k-mer weighting and repeat separation. Genome Research, 27(5), 722-736. [[5](https://academic.oup.com/bioinformatics/article/33/13/i319/3953959)]：Vaser, R., Sović, I., Nagarajan, N., & Šikić, M. (2017). Fast and accurate de novo genome assembly from long uncorrected reads. Bioinformatics, 33(13), i319-i327. [[6](https://www.biorxiv.org/content/10.1101/2020.02.19.958376v2.full.pdf)]：Zhang, Y., Chen, Q., Liu, T., Wang, J., Yang, L., Fu, Y., ... & Xie, X. (2020). DeepEC: leveraging deep learning to improve metagenomic binning efficiency. BMC Bioinformatics, 21(1), 1-12. [[7](https://www.biorxiv.org/content/10.1101/2021.02.16.431995v1.full.pdf)]：Sheng, Z., Bai, Y., Song, Y., Ouyang, Z., Huang, Y., Xiang, J., ... & Jin, Y. (2021). DeepMHC: prediction of peptides binding to MHC molecules using deep learning. Bioinformatics. [[8](https://www.biorxiv.org/content/10.1101/2021.04.18.440919v1.full.pdf)]：Hou, J., Li, R., Li, Y., Li, J., Li, H., Liu, G., ... & Peng, S. (2021). A deep learning-based error correction algorithm for Pacific Biosciences long reads with raw signals. bioRxiv. [[9](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7048421/)]：Wick, R. R., Judd, L. M., Gorrie, C. L., & Holt, K. E. (2020). Unicycler: resolving bacterial genome assemblies from short and long sequencing reads. PLoS Computational Biology, 13(6), e1005595. [[10](https://www.biorxiv.org/content/10.1101/2020.04.11.036418v1.full.pdf)]：Vaser, R., Sović, I., Nagarajan, N., & Šikić, M. (2017). Fast and accurate de novo genome assembly from long uncorrected reads. Bioinformatics, 33(13), i319-i327.

wangchuang2017

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
第三代PacBio长read纠错方法

4. 基于信号的纠错方法：利用PacBio长read的原始测序信号来进行纠错，比如DeepSignal [[8](https://www.biorxiv.org/content/10.1101/2021.04.18.440919v1.full.pdf)]和SignalAlign2 [[9](https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7048421/)]。正在为您搜索：第三代PacBio长read纠错方法。
复制链接

扫一扫