氨基酸三字母序列转单字母序列

氨基酸三字母序列转单字母序列

1.氨基酸对照数据

对照数据集:提取码:amin
实例数据:提取码:data
在这里插入图片描述

2. 对照code

#%% 氨基酸的3 to 1  
#导入package
import pandas as pd
from pandas import DataFrame as df
import numpy as np
import re
 
Amino_acid_path="D:\Topic\\alphafold\\Amino_acid.csv"#氨基酸对照表路径
amino_acid=pd.read_csv(Amino_acid_path)
amino_acid=np.array(amino_acid)
amino_acid=amino_acid.tolist()
#%%将氨基酸对照变转化为dict类型
amino_map={}
for i in range(len(amino_acid)):
    amino_map[amino_acid[i][0]]=amino_acid[i][1]

#%%读入三字母氨基酸序列
amino_path="D:\Topic\demodata.txt"
#读入每个氨基酸序列文件
with open(amino_path, 'r', encoding='utf-8') as f:
	aminofile = f.read()  # 读取全部内容后,按行存储为list
    #根据第一个大写字母分割三字母氨基酸并存为列表
aminofileList=re.sub(r"([A-Z])",r" \1",aminofile).split()
#%%
#转化为单字母
amino_one=str()
for j in aminofileList:
    amino_one=amino_one+amino_map[j]
    #保存文件
amino_one_path="D:\Topic\dataresult.fasta"
with open(amino_one_path,'w') as f:
	f.write(amino_one)

在这里插入图片描述
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

柚子味的羊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值