Biopython等处理MSA相关文件

1.biopython简介
2.Biopython SeqIO 读取序列文件,读取信息,写入序列
3.生物信息中的Python 02 | 用biopython解析序列
4.不会编程,如何快速提取序列
5.从FASTA文件中批量提取指定序列【Python脚本】

ls -l *.msa|grep ' 0 7月' #查找MSA为空的文件
ls -l *.msa | awk '$5!="0"{print}' > list0152 #找出MSA不为空的文件
cat list0152 | awk '{print $9}' > uniref50_list0152#取出相关的字符,以便作匹配
sed -i 's/.msa/.a3m/g' uniref50_list0152#将MSA中没有的文件映射到a3m文件中
cat uniref50_list0152 | while read line;do awk 'NR>=1 && NR<3 {print}' $line >> test;done
#将所有a3m中的第一条序列写入到新的文本

6.Pymol & BioPython | PDB文件中氨基酸序列的提取

from Bio import PDB
parser = PDB.PDBParser()
structure = parser.get_structure(‘2FH7’, ‘2FH7.pdb’)
ppb = PDB.PPBuilder()
for pp in ppb.build_peptides(structure):
print (pp.get_sequence())
model = structure[0]
for pp in ppb.build_peptides(model):
print (pp.get_sequence())

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述7.提取pdb氨基酸序列

pymol X.pdb -c -d “save X.fasta”
缺点是不能识别非ATOM 的squence

8.利用 biopython 处理来自蛋白口袋辨识工具的 pdb 文件
在这里插入图片描述
9.Python生物信息学②从PDB文件中提取蛋白序列
在这里插入图片描述
10.python 实战 - 根据已知蛋白名称从基因组提取蛋白序列
11.使用Biopython解析PDB结构
在这里插入图片描述
在这里插入图片描述12.Biopython 从蛋白质结构得到序列
13.Python + 生物信息 02 :Biopython 分析序列
14.Biopython使用4:PDB结构
15.如何从 PDB 文件中提取氨基酸序列 |(自学生信Python第十二天)
在这里插入图片描述提取的序列不对

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值