在利用fastp或者trim-galore过滤fastq文件时报错,报错的问题在于reads的序列长度和序列质量的长度不匹配。检查fastq文件的md5编码,我发现每个样本的fastq2文件没问题,就fastq1有问题,真是太奇怪了。定位到fastq1中错误发生的reads上,发现reads后面的数据格式混乱 (标准的reads四行变为不规律的一堆序列和字符),我猜测这是下载过程中网络问题导致的文件缺失。
解决方法一,如果仅仅是某几条reads出问题,确定出问题的reads的行数,直接删除就好。
解决方法二,如果是大量的格式错误,那就换一个数据下载方法,比如我用的Aspera下载的数据,换成ftp下载就解决这类错误了(感觉这东西看运气,我之前下载了几十个样本都没问题,就偏偏最近下载数据老出问题)。
ERROR: sequence and quality have different length:
最新推荐文章于 2024-04-01 13:43:47 发布