python中序列和列表区别细菌真菌病毒_生物信息中的Python 02 | 用biopython解析序列...

本文介绍了如何使用Biopython库来处理基因序列,包括安装Biopython、读取fasta和gb格式文件、获取序列详细信息、新建序列、序列操作、转录和翻译等基础用法。
摘要由CSDN通过智能技术生成

上一篇文章生物信息中的Python 01 | 从零开始处理基因序列自己造轮子实现了序列的基础操作,但是在Python的世界里,一项工作只要重复的次数多了,那么一定就会有大神来开发相应的包来解决,这个包名就是 Biopython 。接下来我们试着使用它来实现简单的序列处理。

一、准备工作

1、 按照上一篇下载fasta文件的步骤,可以同理得到GeneBank的数据格式

mark

2、现在我们的目录结构是这样的

mark

3、安装Biopython,这里有两种方案:

3.1 用pip安装Biopython,在cmd命令窗口输入

下载Python的包管理工具:pip

mark

下载完,解压,进入解压目录

Linux 下输入

sudo python setup.py install

windows 下,在下载目录,Shift+右键

如下图所示,点击在此处打开命令窗口

mark

输入如下命令

python setup.py install

mark

测试是否安装成功,出现下图所示的提示即表示安装成功

pip -v

mark

进入 Pycharm 的Terminal 窗口,输入以下命令来安装 Biopython

pip install biopython

mark

3.2 直接用安装包安装

window系统:

解压

按住shift并点击右键

在菜单栏点击在此处打开命令窗口,并输入如下命令:pyhton stepy.py install

Linux系统:

打开终端 (快捷键:Ctrl+Alt+T)

在终端输入以下命令

$ wget http://biopython.org/DIST/biopython-1.72.tar.gz

$ tar -zxvf biopython-1.72.tar.gz

$ cd biopython-1.72/

$ sudo python setup.py install

测试是否安装成功

$ python

>>> from Bio.Seq import Seq

>>> seq = Seq('ATCG')

>>> seq

Seq('ATCG')

二、Biopython 基础用法

1 读取常见的序列文件格式(fasta,gb)

from Bio import SeqIO

# 读取包含单个序列 Fasta 格式文件

fa_seq = SeqIO.read("res/sequence1.fasta", "fasta")

# print fa_seq

# 读取包含多个序列的 fasta 格式文件

for fa in SeqIO.parse("

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值