处理
https://bioinf.shenwei.me/seqkit/
安装
$ conda install -c bioconda seqkit
conda 还真是方便啊……
统计了一下上次NGS拼接后截出来的300个seq
$ seqkit stats testM300.fa
file format type num_seqs sum_len min_len avg_len max_len
testM300.fa FASTA DNA 300 127,344 366 424.5 490
试一下NGS的整个文件,也很快出结果
$ seqkit stats outM.fa
file format type num_seqs sum_len min_len avg_len max_len
outM.fa FASTA DNA 10,760,889 4,571,253,828 250 424.8 4