如何安装biopython_Biopython踩坑之路(一)

声明:本人纯计算机背景,没有生物背景,要是什么名词翻译不好请指正

1、安装Biopython

pip install biopython

2、创建自己的序列

from Bio.Seq import Seq

my_seq = Seq("AGTACACTGGT")

print(my_seq)

>>>AGTACACTGGT

3、简单的序列文件解析

这里是两个FASTA和Genbank格式的文件,可以用记事本打开看https://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.fasta​raw.githubusercontent.comhttps://raw.githubusercontent.com/biopython/biopython/master/Doc/examples/ls_orchid.gbk​raw.githubusercontent.com

3.1 读FASTA文件

from Bio import SeqIO

for seq_record in SeqIO.parse("ls_orchid.fasta", "fasta"):

print(seq_record.id)#查看ID

print(repr(seq_record.seq))#查看序列

print(len(seq_record))#查看序列长度

3.2 读GenBank文件

from Bio import SeqIO

for seq_record in SeqIO.parse("ls_orchid.gbk", "genbank"):

print(seq_record.id)

print(repr(seq_record.seq))

print(len(seq_record))

4、对序列的一些简单操作

像操作字符串一样

from Bio.Seq import Seq

my_seq = Seq("GATCG")

for index, letter in enumerate(my_seq):

print("%i %s" % (index, letter))

输出:

0 G

1 A

2 T

3 C

4 G

print(my_seq[0]) #first letter

print(my_seq[2]) #third letter

print(my_seq[-1]) #last letter

输出:

G

T

G

觉得下面这个挺有用的。

from Bio.Seq import Seq

>>> "AAAA".count("AA")

2

>>> Seq("AAAA").count("AA")

2

5、序列对比

from Bio.Seq import Seq

seq1 = Seq("ACGT")

seq2 = Seq("ACGT")

print(str(seq1) == str(seq2))

print(str(seq1) == str(seq1))

print(seq1 == "ACGT")

输出:

True

True

True

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值