由于连接测序仪的服务器不知道哪里抽了风,无法直接的生成fastq格式的文件,好久都无解,经过一段时间仍无法解决,所以采用曲线救国的方法,看能不能利用三方软件将bcl转换成fastq文件
google以后发现illumina的OLB(off-line Basecaller)软件可以实现从bcl格式转换成qseq格式,而qseq格式就可以通过简单的perl或者shell或者java脚本转换成fastq格式。还有一种策略是利用picard的IlluminaBcl2sam转换成sam格式,然后再从sam转换成fastq格式(虽然没有采用这种方法,但是隐隐的感觉该方法可能转换出来的数据不理想,而且中间生成的sam文件也比较大比较占空间,加上感觉参数指定的时候很多文件例如positionfile ,filterfile都没用上)。本人对bcl格式知道的不多,测序生成的rawdata原始文件夹有个Intensitive 而该文件夹又含有basecall文件夹和很多的positionfile,虽然不知道position file是干嘛的,但是后面采用OLB软件转换的时候会用到这些文件,basecalling文件夹下又含有不同lane的信息例如L001等,打开每个lane文件夹进去看,发现很多C打头的文件夹,这些文件夹根据我的理解就是变合成边测序产生circle文件,每个circle代表一个碱基。点开进去就是我们需要转换的bcl文件了。
下面从基本的OBL安装开始(http://support.illumina.com/documents/MyIllumina/ec3129a6-b41f-4d98-963f-668391997f1a/OLB_194_UserGuide_15009920D.pdf 这是manual)
简单说一下 ,这个安装时很麻烦的ÿ