提取每条fasta序列的前500bp【Python】

最新推荐文章于 2023-10-11 11:54:54 发布

每天都要学Python

最新推荐文章于 2023-10-11 11:54:54 发布

阅读量1.3k

点赞数

分类专栏：生信脚本文章标签： python fasta

本文链接：https://blog.csdn.net/weixin_42358077/article/details/94591042

版权

生信脚本专栏收录该内容

5 篇文章 8 订阅

订阅专栏

最近看到同学用Perl写了一个提取fasta序列前500bp的脚本，于是自己用Python也写了一个实现相同功能的脚本。

脚本内容如下：

"""
@author: will
@Date:  July 2019
@E-mail: willgyw@126.com
@Description: 
"""

import sys
seq = {}
res = open('500bp.fa', 'w')
with open(sys.argv[1], 'r') as fa:
    for line in fa:
        if line.startswith('>'):
            name = line.strip().split()[0][1:]
            seq[name] = ''
        else:
            seq[name] += line.replace('\n', '')
            
for k, v in seq.items():
    if len(v) <= 500:
        res.write('>' + k+ '\n' + v + '\n')
    else:
        res.write('>' + k+ '\n' + v[:500] + '\n')
        
res.close()

楼主也是刚刚接触生信的新手，如有错误，欢迎指正。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

每天都要学Python

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
提取每条fasta序列的前500bp【Python】

最近看到同学用Perl写了一个提取fasta序列前500bp的脚本，于是自己用Python也写了一个实现相同功能的脚本。脚本内容如下："""@author: will@Date: July 2019@E-mail: willgyw@126.com@Description: """import sysseq = {}res = open('500bp.fa', 'w')...
复制链接

扫一扫