(2)二代重测序基因组拼接组装(自整理)

目录

一、数据基本处理

 二、fastq碱基质量控制

三、SPAdes从头组装 

四、用quast来评估组装质量

五、用BUSCO评估组装质量

首先,拿到华大公司的测序文件,自己磁盘留存,然后上传服务器。(以U.antarctica为例)

一、数据基本处理

$ mkdir U.antarctica 
$ cd U.antarctica  

$ gunzip *.gz 
$ cat XX_1.fq XX_3.fq > U.antarctica_1.fastq  
将对应端序列合并
$ cat XX_2.fq XX_4.fq > U.antarctica_2.fastq 
若一次性测序完毕,则不需要合并仅解压就行

 二、fastq碱基质量控制

记得先建立输出目录~

$ mkdir XX_fastqc 
建立输出目录
$ fastqc -o XX_fastqc -t 10 U.antarctica_1.fastq U.antarctica_2.fastq 
双端
运用FastQC进行质量评估,输出结果在所建立目录下,运用10个线程进行工作,对XX.fq(可多个)进行质量评估

$ fastqc -o BJ_UM_map_result_fastqc -t 10 BJ_UM_map_sort.fastq 
单端
用FastQC一定要先给它建立文件夹,这个笨软件不会自己建!

fastqc结果可以看到碱基质量情况、GC含量等(主要是我的数据GC老有双峰,后面一直在想办法去除这个问题&#x

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值