生物信息学基础知识（四）

最新推荐文章于 2024-03-17 20:29:08 发布

jkl_bio

最新推荐文章于 2024-03-17 20:29:08 发布

阅读量320

点赞数

文章标签： python 开发语言

本文链接：https://blog.csdn.net/weixin_44619692/article/details/130259853

版权

本文介绍了用于测序数据质控的FastQC工具，它能对数据进行质量检查；MultiQC则可以汇总FastQC的结果；FASTX-Toolkit提供了一系列处理FASTA/FastQ数据的命令，包括序列转换、质量评估、修剪、过滤等操作。

摘要由CSDN通过智能技术生成

一、fastqc
用来对测序数据进行质控
下载安装：
https://www.bioinformatics.babraham.ac.uk/projects/download.html#fastqc
linux可以用：conda install fastqc
![](media/16818718815431/16818731562759.jpg)
使用方法：
fastqc test.fq
# 常用参数 -t 线程数 -o 输出路径

二、multiqc
对fastqc质控后的数据进行汇总
下载安装：
conda install multiqc
使用方法：
multiqc *

三、FASTX-Toolkit
处理fa/fq数据
下载安装：
http://hannonlab.cshl.edu/fastx_toolkit/download.html
常用命令：
fastq_to_fasta fq文件转为fa文件
fastq_to_fasta -i input.fq -o out.fa

fastx_quality_stats 用于评估快速测序数据质量，可读取fq或fa文件
fastx_quality_stats -i input.fq -o output.txt

fastq_quality_boxplot_graph.sh 绘制质量图
fastq_quality_boxplot_graph.sh -i input.fq -o output.pdf

fastx_nucleotide_distribution_graph.sh 核苷酸分布绘图
fastx_nucleotide_distribution_graph.sh -i input.fa -o output.pdf

fastx_clipper 用于从快速测序数据中剪切（剔除）引物或适配器序列
fastx_clipper -i input.fq -o output.fq -a ACACTCTTTCCCTACCTCTTCCG -c

fastx_renamer 用于修改快速测序数据中序列 ID 或名称
fastx_renamer -i input.fq -o output.fq -n sample_ -c

fastx_trimmer 用于快速测序数据中序列修剪
fastx_trimmer -i input.fq -o output.fq -f 15 -l 80

fastx_collapser 用于将具有相同序列的 FASTA 或 FASTQ 序列合并成一个单一的序列
fastx_collapser -i input.fa -o output.fa

fastx_artifacts_filter 用于过滤和修剪快速测序（例如 Illumina）数据中的低质量序列和序列伪装物（例如适配器序列）
fastx_artifacts_filter -i input.fq -o output.fq

fastq_quality_filter 用于从快速测序数据中去除质量较差的序列
fastq_quality_filter -i input.fq -o output.fq -q 20 -p 80

fastx_reverse_complement 用于对 FASTA 或 FASTQ 格式的序列文件进行反向互补操作
fastx_reverse_complement -i input.fq -o output.fq

fasta_formatter 用于对 FASTA 格式序列文件进行格式化操作
fasta_formatter -i input.fa -o output.txt -w 80

fasta_nucleotide_changer 用于在 DNA 和 RNA 之间进行转换
fasta_nucleotide_changer -i input.fa -o output.fasta -r

fasta_clipping_histogram.pl 用于生成基于质量值的序列片段截断分布直方图
fasta_clipping_histogram.pl -i input.fq -o output.txt

fastx_barcode_splitter.pl 用于将带有条形码的样本分离为不同的文件
fastx_barcode_splitter.pl --bcfile barcodes.txt -i input.fastq -o output_directory/ --prefix {name}_ --suffix .fastq