Biopython等处理MSA相关文件

最新推荐文章于 2023-11-08 15:47:24 发布

病树前头

最新推荐文章于 2023-11-08 15:47:24 发布

阅读量376

点赞数 1

分类专栏：生物信息文章标签： python linux

本文链接：https://blog.csdn.net/yin1331102028yin/article/details/126134191

版权

生物信息专栏收录该内容

12 篇文章 0 订阅

订阅专栏

1.biopython简介
2.Biopython SeqIO 读取序列文件，读取信息，写入序列
3.生物信息中的Python 02 | 用biopython解析序列
4.不会编程，如何快速提取序列
5.从FASTA文件中批量提取指定序列【Python脚本】

ls -l *.msa|grep ' 0 7月' #查找MSA为空的文件

ls -l *.msa | awk '$5!="0"{print}' > list0152 #找出MSA不为空的文件

cat list0152 | awk '{print $9}' > uniref50_list0152#取出相关的字符，以便作匹配

sed -i 's/.msa/.a3m/g' uniref50_list0152#将MSA中没有的文件映射到a3m文件中

cat uniref50_list0152 | while read line;do awk 'NR>=1 && NR<3 {print}' $line >> test;done
#将所有a3m中的第一条序列写入到新的文本

6.Pymol & BioPython | PDB文件中氨基酸序列的提取

from Bio import PDB
parser = PDB.PDBParser()
structure = parser.get_structure(‘2FH7’, ‘2FH7.pdb’)
ppb = PDB.PPBuilder()
for pp in ppb.build_peptides(structure):
print (pp.get_sequence())
model = structure[0]
for pp in ppb.build_peptides(model):
print (pp.get_sequence())

在这里插入图片描述

7.提取pdb氨基酸序列