利用ANARCI标识CDR区域

13 篇文章 2 订阅
6 篇文章 0 订阅

brief

总有一些朋友丢给我一些抗体蛋白序列,希望我把抗体的框架区和高变区标识出来。
然后ANARCI 可以对抗蛋白序列的氨基酸进行编号和allign。
所以我想ANARCI可以解决这个问题。

安装

github开源软件:
https://github.com/oxpig/ANARCI

也有网页版的:
https://opig.stats.ox.ac.uk/webapps/sabdab-sabpred/sabpred/anarci/

conda install biopython
conda install hmmer

python3 setup.py install
ANARCI -h

使用

head ./cut.seq.fa
ANARCI -i ./cut.seq.fa --scheme imgt --csv -o 20230823 # 产生一个 20230823_H.csv文件
# 根据编号将Framework & CDR 分开
python3 ./user_script/print_H.py  ./20230823_H.csv > ./result.cut.txt

在这里插入图片描述
在这里插入图片描述

cat   ./user_script/print_H.py
#!/public/home/djs/miniconda3/bin/python

# DATE:20230302
# AUTHOR:JiangshanDai

import sys


file = sys.argv[1]
name = []
FW1 = []
CDR1 = []
FW2 = []
CDR2 = []
FW3 = []
CDR3 = []
FW4 = []

with open(file,"r") as f:
    next(f)
    for line in f.readlines():
        name.append(line.split(",")[0])
        FW1.append("".join(line.split(",")[13:39]).replace("-",""))
        CDR1.append("".join(line.split(",")[39:51]).replace("-",""))
        FW2.append("".join(line.split(",")[51:68]).replace("-",""))
        CDR2.append("".join(line.split(",")[68:81]).replace("-",""))
        FW3.append("".join(line.split(",")[81:120]).replace("-",""))
        CDR3.append("".join(line.split(",")[120:-11]).replace("-",""))
        FW4.append("".join(line.split(",")[-11:]).replace("-",""))

context = zip(name,FW1,CDR1,FW2,CDR2,FW3,CDR3,FW4)

for i in context:
    print(i[0],i[1],i[2],i[3],i[4],i[5],i[6],i[7])
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值