点击蓝字↑↑↑“微生态”,轻松关注不迷路
本文由阿童木根据实践经验而整理,希望对大家有帮助。
原创微文,欢迎转发转载。
Fasta文件有两种常见的格式,一种是一行序列名加一行序列,另一种是一行序列名加多行序列(每60个碱基换行)。下面分享两个用python处理和统计第二种fasta文件的脚本:
1. 去除fasta文件的换行符
2. 计算[换行符分隔]fasta文件每条序列的GC含量
二、去除fasta文件的换行符
1. 1 输入数据
cat test
# 一个随便写的文件
>sequence_1
AAAA
GGGG
CCCC
TTTT
>sequence_2
aaaa
gggg
cccc
tttt
1.2 Python3代码</