Biopython从pdb文件中提取蛋白质链的信息

最新推荐文章于 2024-10-08 12:37:10 发布

qq_27390023

最新推荐文章于 2024-10-08 12:37:10 发布

阅读量341

点赞数 1

文章标签：开发语言 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_27390023/article/details/142069010

版权

使用Biopython的PDB模块可以方便地解析PDB文件并提取你需要的信息。下面是一个示例代码，用于提取PDB文件中的链名称、序列和长度：

示例代码

from Bio import PDB

# 读取PDB文件
pdb_file = "/Users/zhengxueming/Downloads/1a0h.pdb"
parser = PDB.PDBParser(QUIET=True)
structure = parser.get_structure("protein", pdb_file)

# 初始化保存信息的列表
chain_info = []

# 遍历所有模型、链和残基
for model in structure:
    for chain in model:
        chain_id = chain.id
        sequence = []
        for residue in chain:
            # 检查是否是标准氨基酸
            if PDB.is_aa(residue):
                sequence.append(PDB.Polypeptide.three_to_one(residue.resname))
        # 提取链的序列和长度
        seq_str = ''.join(sequence)
        chain_length = len(sequence)
        chain_info.append((chain_id, chain_length, seq_str))

# 打印链的信息
for chain_id, chain_length, seq_str in chain_info:
    print(f"链ID: {chain_id}, 长度: {chain_length}, 序列: {seq_str}")

代码说明

PDBParser：用于解析PDB文件。
structure：从PDB文件中解析得到的蛋白质结构对象。
is_aa(residue)：检查是否为标准氨基酸。
three_to_one(residue.resname)：将三字母氨基酸代码转换为一字母代码。
链长度和序列：对于每个链，计算其序列并记录长度。

如果你有特定的需求，比如要处理非标准氨基酸或不同的残基类型，也可以根据需要调整代码。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_27390023 CSDN认证博客专家 CSDN认证企业博客

码龄10年

825: 原创

4966: 周排名

2410: 总排名

88万+: 访问

: 等级

1万+: 积分

2137: 粉丝

2665: 获赞

60: 评论

4908: 收藏

私信

关注

热门文章

最新评论

构建掩码多序列比对（masked msa）特征
suezhang123: 您好！我有问题需要咨询您！①您这个小模型，需要输入什么文件呢？怎么得到msa文件，是输入一条序列，在库中索引形成多序列对比msa文件？还是直接输入msa文件？②这个小模型可以单独运行吗？我没有看到输入msa文件的交互函数？我想单独运行这个文件，看一看这个探针概率分布和掩码矩阵的规律。
pytorch torch.matmul函数介绍
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
java.lang.annotation包介绍
小王毕业啦: 博主的文章真是让我大开眼界，对java.lang.annotation包有了全新的认识。文章中的细节描述非常到位，展现了博主的深厚功底和专业水平。期待博主未来能够继续分享更多这样有价值的文章，也希望能够得到博主的指导，共同进步。在此感谢博主的分享和支持！
R语言p值校正函数p.adjust
chnyng: com_result_tst数据集的pval列
ballgown包进行基因差异表达分析
weixin_41796802: # length(structure(m_bg)$exon) # length(structure(m_bg)$intron) # length(structure(m_bg)$trans在数据读入部分，这3行为什么要注释掉呢？

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。