fastqc检验时不能执行java_利用fastqc检测原始序列的质量

FastQC是一款基于Java的Linux环境下测序数据质量评估工具。本文介绍了FastQC的基本用法,包括命令行参数解释,如输出路径、线程数设置等,并详细解读了FastQC报告的各个部分,如序列质量、碱基比例、GC含量等,帮助理解测序数据的质量状况。
摘要由CSDN通过智能技术生成

FastQC是一款基于Java的软件,一般都是在linux环境下使用命令行运行,它可以快速多线程地对测序数据进行质量评估(Quality Control),其官网地址为:Babraham Bioinformatics

FastQC的下载和安装,和一般的Java软件没有什么区别,我们在这里就不做介绍了,在成功安装好以后,我们就在命令行模式下,输入fastqc就可以调用这个程序,这时候我们可以选择 --help选项查看帮助文档:

# 基本格式# fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN

# 主要是包括前面的各种选项和最后面的可以加入N个文件

# -o --outdir FastQC生成的报告文件的储存路径,生成的报告的文件名是根据输入来定的

# --extract 生成的报告默认会打包成1个压缩文件,使用这个参数是让程序不打包

# -t --threads 选择程序运行的线程数,每个线程会占用250MB内存,越多越快咯

# -c --contaminants 污染物选项,输入的是一个文件,格式是Name [Tab] Sequence,里面是可能的污染序列,如果有这个选项,FastQC会在计算时候评估污染的情况,并在统计的时候进行分析,一般用不到

# -a --adapters 也是输入一个文件,文件的格式Name [Tab] Sequence,储存的是测序的adpater序列信息,如果不输入,目前版本的FastQC就按照通用引物来评估序列时候有adapter的残留

# -q --quiet 安静运行模式,一般不选这个选项的时候,程序会实时报告运行的状况。

简单使用:

fastqc -o qc -t 10 KPGP-00001_L1_R1.fq.gz

运行一段时间以后,就会在qc文件夹中出现以下报告文件:

KPGP-00001_L1_R1_fastqc.html KPGP-00001_L1_R1_fastqc.zip

使用浏览器打开后缀是html的文件,就是图表化的fastqc报告。

1、Summary

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值