目录
首先,拿到华大公司的测序文件,自己磁盘留存,然后上传服务器。(以U.antarctica为例)
一、数据基本处理
$ mkdir U.antarctica
$ cd U.antarctica
$ gunzip *.gz
$ cat XX_1.fq XX_3.fq > U.antarctica_1.fastq
将对应端序列合并
$ cat XX_2.fq XX_4.fq > U.antarctica_2.fastq
若一次性测序完毕,则不需要合并仅解压就行
二、fastq碱基质量控制
记得先建立输出目录~
$ mkdir XX_fastqc
建立输出目录
$ fastqc -o XX_fastqc -t 10 U.antarctica_1.fastq U.antarctica_2.fastq
双端
运用FastQC进行质量评估,输出结果在所建立目录下,运用10个线程进行工作,对XX.fq(可多个)进行质量评估
$ fastqc -o BJ_UM_map_result_fastqc -t 10 BJ_UM_map_sort.fastq
单端
用FastQC一定要先给它建立文件夹,这个笨软件不会自己建!
fastqc结果可以看到碱基质量情况、GC含量等(主要是我的数据GC老有双峰,后面一直在想办法去除这个问题&#x