Biopython项目是一个由免费提供的Python(https://www.python.org)工具开发人员的国际协会,用于计算分子生物学。Python是一种面向对象,解释灵活的语言,在科学计算中越来越受欢迎。Python易于学习,语法非常清晰,可以使用C,C ++或FORTRAN编写的模块轻松扩展。
Biopython网站(http://www.biopython.org)为基于Python的软件开发人员提供模块,脚本和Web链接的在线资源,用于生物信息学的使用和研究。基本上,Biopython的目标是通过创建高质量,可重用的模块和类,使Python尽可能容易地用于生物信息学。Biopython功能包括各种生物信息学文件格式(BLAST,Clustalw,FASTA,Genbank等)的解析器,访问在线服务(NCBI,Expasy,...),与常见和不常见程序的接口(Clustalw, DSSP,MSMS ...),标准序列类,各种聚类模块,KD树数据结构等甚至文档。
基本上,我们只是想用Python编程,并希望通过创建高质量,可重用的模块和脚本,尽可能简单地将Python用于生物信息学。
1.2 我可以在Biopython包中找到什么
主要的Biopython版本具有许多功能,包括:能够将生物信息学文件解析为Python可利用的数据结构,包括支持以下格式:Blast输出 - 来自单独的blast软件和在线Blast
CLUSTALW
FASTA
GenBank
PubMed和Medline