1.biopython简介
2.Biopython SeqIO 读取序列文件,读取信息,写入序列
3.生物信息中的Python 02 | 用biopython解析序列
4.不会编程,如何快速提取序列
5.从FASTA文件中批量提取指定序列【Python脚本】
ls -l *.msa|grep ' 0 7月' #查找MSA为空的文件
ls -l *.msa | awk '$5!="0"{print}' > list0152 #找出MSA不为空的文件
cat list0152 | awk '{print $9}' > uniref50_list0152#取出相关的字符,以便作匹配
sed -i 's/.msa/.a3m/g' uniref50_list0152#将MSA中没有的文件映射到a3m文件中
cat uniref50_list0152 | while read line;do awk 'NR>=1 && NR<3 {print}' $line >> test;done
#将所有a3m中的第一条序列写入到新的文本
6.Pymol & BioPython | PDB文件中氨基酸序列的提取
from Bio import PDB
parser = PDB.PDBParser()
structure = parser.get_structure(‘2FH7’, ‘2FH7.pdb’)
ppb = PDB.PPBuilder()
for pp in ppb.build_peptides(structure):
print (pp.get_sequence())
model = structure[0]
for pp in ppb.build_peptides(model):
print (pp.get_sequence())
pymol X.pdb -c -d “save X.fasta”
缺点是不能识别非ATOM 的squence
8.利用 biopython 处理来自蛋白口袋辨识工具的 pdb 文件
9.Python生物信息学②从PDB文件中提取蛋白序列
10.python 实战 - 根据已知蛋白名称从基因组提取蛋白序列
11.使用Biopython解析PDB结构
12.Biopython 从蛋白质结构得到序列
13.Python + 生物信息 02 :Biopython 分析序列
14.Biopython使用4:PDB结构
15.如何从 PDB 文件中提取氨基酸序列 |(自学生信Python第十二天)
提取的序列不对