一、fastqc
用来对测序数据进行质控
下载安装:
https://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc
linux可以用:conda install fastqc
![](media/16818718815431/16818731562759.jpg)
使用方法:
fastqc test.fq
# 常用参数 -t 线程数 -o 输出路径
二、multiqc
对fastqc质控后的数据进行汇总
下载安装:
conda install multiqc
使用方法:
multiqc *
三、FASTX-Toolkit
处理fa/fq数据
下载安装:
http://hannonlab.cshl.edu/fastx_toolkit/download.html
常用命令:
fastq_to_fasta fq文件转为fa文件
fastq_to_fasta -i input.fq -o out.fa
fastx_quality_stats 用于评估快速测序数据质量,可读取fq或fa文件
fastx_quality_stats -i input.fq -o output.txt
fastq_quality_boxplot_graph.sh 绘制质量图
fastq_quality_boxplot_graph.sh -i input.fq -o output.pdf
fastx_nucleotide_distribution_graph.sh 核苷酸分布绘图
fastx_nucleotide_distribution_graph.sh -i input.fa -o output.pdf
fastx_clipper 用于从快速测序数据中剪切(剔除)引物或适配器序列
fastx_clipper -i input.fq -o output.fq -a ACACTCTTTCCCTACCTCTTCCG -c
fastx_renamer 用于修改快速测序数据中序列 ID 或名称
fastx_renamer -i input.fq -o output.fq -n sample_ -c
fastx_trimmer 用于快速测序数据中序列修剪
fastx_trimmer -i input.fq -o output.fq -f 15 -l 80
fastx_collapser 用于将具有相同序列的 FASTA 或 FASTQ 序列合并成一个单一的序列
fastx_collapser -i input.fa -o output.fa
fastx_artifacts_filter 用于过滤和修剪快速测序(例如 Illumina)数据中的低质量序列和序列伪装物(例如适配器序列)
fastx_artifacts_filter -i input.fq -o output.fq
fastq_quality_filter 用于从快速测序数据中去除质量较差的序列
fastq_quality_filter -i input.fq -o output.fq -q 20 -p 80
fastx_reverse_complement 用于对 FASTA 或 FASTQ 格式的序列文件进行反向互补操作
fastx_reverse_complement -i input.fq -o output.fq
fasta_formatter 用于对 FASTA 格式序列文件进行格式化操作
fasta_formatter -i input.fa -o output.txt -w 80
fasta_nucleotide_changer 用于在 DNA 和 RNA 之间进行转换
fasta_nucleotide_changer -i input.fa -o output.fasta -r
fasta_clipping_histogram.pl 用于生成基于质量值的序列片段截断分布直方图
fasta_clipping_histogram.pl -i input.fq -o output.txt
fastx_barcode_splitter.pl 用于将带有条形码的样本分离为不同的文件
fastx_barcode_splitter.pl --bcfile barcodes.txt -i input.fastq -o output_directory/ --prefix {name}_ --suffix .fastq