一、序列操作。
seqkit seq [flags] file
参数:
-p, --complement 取互补序列
--dna2rna DNA to RNA
-l, --lower-case 将序列以小写字母形式输出
-g, --remove-gaps 移除组装序列中的gap
-r, --reverse 取反向序列
--rna2dna RNA to DNA
-u, --upper-case 将序列以大写字母形式输出
-w, --line-width int 以每行指定长度输出序列 (0 for no wrap) (default 60)
举例:
seqkit seq test.fa -w 0#将此文件fasta序列转换成一行输出
seqkit seq -w 100 test.fa#将此文件fasta序列转换成100个碱基一行输出
seqkit seq --dna2rna test.fa#将此文件fasta序列dna转换成rna
seqkit seq -w 100 -p -r test.fa#将此文件fasta序列反向互补输出,每行100碱基
二、Fasta/q之间及与tab格式互换
1、FASTQ转换成FASTA: seqkit fq2fa
举例:
seqkit fq2fa reads_1.fq -o reads_1.fa
2、FASTA/FASTQ转换成tab格式。seqkit fx2tab
举例:
seqkit fx2tab test.fa>test.fa.tab.fa
seqkit fx2tab test.fq>test.fq.tab.fq
tab格式:ID sequence