Alphafold批量下载蛋白的pdb文件

最新推荐文章于 2024-06-04 15:20:56 发布

原创

最新推荐文章于 2024-06-04 15:20:56 发布 · 2k 阅读

5 ·

CC 4.0 BY-SA版权

文章标签：

#python #经验分享 #笔记

本文介绍了一个使用Python和Selenium库编写的脚本，自动化从Alphafold下载指定蛋白质pdb文件的过程，尽管速度较慢，但解决了手动下载时的限制。

之前在做分子对接，在网上查了一圈，没有找到合适的工具从Alphafold批量下载指定蛋白的pdb文件。于是打算用爬虫解决这个问题，但是只能从Alphafold下载第一个蛋白，后面的请求就被拒绝了，于是选择自动化模拟点击完成这个工作，缺点是速度慢。下面上代码正文：

import os
from selenium import webdriver
from selenium.webdriver.common.by import By
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.service import Service
from selenium.webdriver import ChromeOptions
from selenium.webdriver.chrome.options import Options
import requests
import time
import shutil
chrome_options = Options()
# chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
option = ChromeOptions()
option.add_experimental_option('excludeSwitcher', ['enable-automation'])
service = Service(executable_path=ChromeDriverManager().install())

# 设置工作路径
path=r"D:\知乎\Alphafold蛋白下载器"

os.chdir(path)
# 记录需要下载的蛋白的文件
file="test.txt"
with open(file,"r")as f:
    protein=f.readlines()
faild=""

for ID in protein:
    ID=ID.replace("\n","")
    print(ID+"

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_37440906

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

PDB之批量并行下载PDB文件

Protein Designer的博客

04-19

561

本文介绍了一种优化PDB文件批量下载效率的方法。针对RCSB PDB官方脚本串行下载效率低下的问题，作者开发了支持并行下载的改进脚本。该脚本通过后台任务并发处理多个下载请求，设置了最大并发数限制（默认8个），有效利用网络带宽和CPU资源。脚本兼容官方参数格式，支持多种文件类型下载（cif.gz、pdb.gz等），并自动检测curl依赖。实测表明，该方案可显著提升大规模PDB数据获取效率，适用于结构生物学和生物信息学研究中的批量数据处理场景。

Python：批量下载已知gene symbol蛋白的PDB文件

3 条评论

sample19 2024.08.26
感谢博主，实践后发现这样定位更精准一点： button=driver.find_element(By.LINK_TEXT, "PDB file") driver.execute_script("arguments[0].click();", button)

小白学代码。。。 2023.12.04
AttributeError: 'NoneType' object has no attribute 'split'报这个错误

CSDN-Ada助手 2023.08.07
恭喜你开始博客创作！标题看起来非常有趣，对于想要批量下载蛋白的pdb文件的人来说，这篇博客一定会很有帮助。我期待着阅读你的文章，了解Alphafold是如何实现这一功能的。另外，如果可能的话，我建议你在文章中加入一些实际案例或者使用指南，这样读者可以更好地理解和运用这个技术。祝你在博客创作的旅程中取得更多成就！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1