使用短 Illumina 读取和长 PacBio 读取对混合校正和组装进行基准测试

Benchmarking Hybrid Correction and Assembly Using Short Illumina Reads and Long PacBio Reads

Ma Dongna;Zhang Xingtan;Wei Liufeng;Li Yiying;Zhong Weimin;Zhao Qian;YouMinsheng;State Key Laboratory of Ecological Pest Control for Fujian and Taiwan Crops, Fujian Agriculture and Forestry University;Institute of Applied Ecology, Fujian Agriculture and Forestry University;Key Laboratory of Integrated Pest Management for Fujian-Taiwan Crops, Ministry of Agriculture;Key Laboratory of Green Control of Insect Pests (Fujian Agriculture and Forestry University), Fujian Province University;Center for Genomic and Biotechnology, Fujian Agriculture and Forestry University;  

The Pacific Bio Sciences(Pac Bio) sequencing platform, a single molecular sequencing technology(Iso-Seq) offers great improvement over current sequencing technologies because of its high throughput, fast speed,and longer reads. However, compared with the second generation sequencing(SGS) technologies, the error rate of Pac Bio is fairly higher, leading to a lower accuracy of assembly. In order to reduce errors and improve the assembly, we generated the simulated data from Arabidopsis thaliana to compare and evaluate the results of corrected rate and hybrid assembly based on different software as well as different read depths, which would optimize the hybrid assembly result through improve the assembly tragedy including sequencing depth and software. Using different correction software of PBc R, Lo RDEC, Jabba and Proovread, we found that Lo RDEC increases the accuracy of nucleic acids from 85% to 99% at the fastest speed, generated a better correction. Then,we simulated different read depths with 20×~100× for SGS and 20×~50× for Iso-Seq to further test the assemble quality. We used different assemble software including three hybrid assembly software and two third generation assembly software to evaluate the assembly. We found that the hybrid assembly software DBG2 OLC and the third generation assembly software canu produced better assembly and gene completeness.


马东娜;张兴坛;魏留峰;李以英;钟伟民;赵倩;游民生;福建农林大学闽台作物生态病虫害防治国家重点实验室;福建农林大学应用生态研究所;农业部闽台作物病虫害综合治理重点实验室;福建省大学病虫害绿色防治重点实验室(福建农林大学);福建农林大学基因组与生物技术中心;  
太平洋生物科学(Pac Bio)测序平台是一种单分子测序技术(Iso-Seq),由于其高通量、快速和更长的读取时间,对现有测序技术进行了极大的改进。
然而,与第二代测序(SGS)技术相比,Pac Bio的错误率相当高,导致组装精度较低。为了减少错误和改进组装,我们生成了拟南芥的模拟数据,以比较和评估基于不同软件和不同读取深度的校正率和混合组装结果,通过改进来优化混合组装结果。
组装悲剧包括测序深度和软件。使用PBc R、Lo RDEC、Jabba和Proovread不同的校正软件,我们发现 Lo RDEC 以最快的速度将核酸的准确率从 85% 提高到 99%,产生了更好的校正。
然后,我们模拟了不同的读取深度,SGS 为 20×~100×,Iso-Seq 为 20×~50×,以进一步测试组装质量。我们使用了不同的组装软件,包括三个混合组装软件和两个第三代组装软件来评估组装。我们发现混合组装软件 DBG2 OLC 和第三代组装软件 canu 产生了更好的组装和基因完整性。我们使用了不同的组装软件,包括三个混合组装软件和两个第三代组装软件来评估组装。
我们发现混合组装软件 DBG2 OLC 和第三代组装软件 canu 产生了更好的组装和基因完整性。我们使用了不同的组装软件,包括三个混合组装软件和两个第三代组装软件来评估组装。我们发现混合组装软件 DBG2 OLC 和第三代组装软件 canu 产生了更好的组装和基因完整性。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangchuang2017

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值