假设fasta1如下:
>001
ATG
ATG
>001
AAC
AAT
>002
AAA
TTT
转换后的文件如下:
>001
ATGATG
>001
AACAAT
>002
AAATTT
方法1:
less fasta1 | tr '\n' '\t' | sed 's/\t>/\n>/g' |sed 's/\t/\n/' | sed 's/\t//g' | less
总结:
这个方法特别好,因为fasta1文件中存在两个001序列,一般的方法在对fasta1处理之后,会只保留单一的文件名,比如,两个001,在处理之后,只会保留一个
方法2:
less fasta1 | awk '/^>/&&NR>1{print "";}{printf "%s",/^>/?$0"\n":$0}' | less
总结:
这个方法也挺好,因为fasta1文件中存在两个001序列,一般的方法在对fasta1处理之后,会只保留单一的文件名,比如,两个001,在处理之后,只会保留一个
方法3:
less fasta1 | awk '{if($0~/>/) name=$0 ;else seq[name]=seq[name]$0;}END{for(i in seq) print i"\n"seq[i]}' | less
总结:
这个方法使用时要注意,因为fasta1文件中存在两个001序列,一般的方法在对fasta1处理之后,会只保留单一的文件名,比如,两个001,在处理之后,只会保留一个
另外:命令看不懂的地方可以参考链接中的详细解释
参考链接:https://blog.csdn.net/weixin_44022515/article/details/104257520