以CASP11数据集为例,选取domain中的pdb数据作为转换:
在python中,安装biopython包和dssp包
pip3 install biopython
conda install -c salilab dssp
python脚本如下,可以提取所有sequence和ss的信息到同一个文档:
from Bio.PDB import DSSP, PDBParser
import os
dir='/***/casp11.domains/'
list=os.listdir('/***/casp11.domains'