之前在做分子对接,在网上查了一圈,没有找到合适的工具从Alphafold批量下载指定蛋白的pdb文件。于是打算用爬虫解决这个问题,但是只能从Alphafold下载第一个蛋白,后面的请求就被拒绝了,于是选择自动化模拟点击完成这个工作,缺点是速度慢。下面上代码正文:
import os
from selenium import webdriver
from selenium.webdriver.common.by import By
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.chrome.service import Service
from selenium.webdriver import ChromeOptions
from selenium.webdriver.chrome.options import Options
import requests
import time
import shutil
chrome_options = Options()
# chrome_options.add_argument('--headless')
chrome_options.add_argument('--disable-gpu')
option = ChromeOptions()
option.add_experimental_option('excludeSwitcher', ['enable-automation'])
service = Service(executable_path=ChromeDriverManager().install())
# 设置工作路径
path=r"D:\知乎\Alphafold蛋白下载器"
os.chdir(path)
# 记录需要下载的蛋白的文件
file="test.txt"
with open(file,"r")as f:
protein=f.readlines()
faild=""
for ID in protein:
ID=ID.replace("\n","")
print(ID+"

本文介绍了一个使用Python和Selenium库编写的脚本,自动化从Alphafold下载指定蛋白质pdb文件的过程,尽管速度较慢,但解决了手动下载时的限制。
最低0.47元/天 解锁文章
561





