利用python处理dna序列_详解基于python的全局与局部序列比对的实现(DNA)

最新推荐文章于 2024-08-17 21:30:16 发布

weixin_39932344

最新推荐文章于 2024-08-17 21:30:16 发布

阅读量1.3k

点赞数 2

文章标签：利用python处理dna序列

本文详细介绍了如何使用Python实现DNA序列的全局与局部比对，包括得分矩阵计算、回溯算法和可视化路径展示。通过用户输入碱基序列和gap值，程序能完成比对并用matplotlib展示比对路径。

摘要由CSDN通过智能技术生成

程序能实现什么

a.完成gap值的自定义输入以及两条需比对序列的输入

b.完成得分矩阵的计算及输出

c.输出序列比对结果

d.使用matplotlib对得分矩阵路径的绘制

一、实现步骤

1.用户输入步骤

a.输入自定义的gap值

b.输入需要比对的碱基序列1（A,T,C,G）换行表示输入完成

b.输入需要比对的碱基序列2（A,T,C,G）换行表示输入完成

输入（示例）：

2.代码实现步骤

1.获取到用户输入的gap，s以及t

2.调用构建得分矩阵函数，得到得分矩阵以及方向矩阵

3.将得到的得分矩阵及方向矩阵作为参数传到回溯函数中开始回溯得到路径，路径存储使用的是全局变量，存的仍然是方向而不是坐标位置减少存储开销，根据全局变量中存储的方向将比对结果输出。

4.根据全局变量中存储的方向使用matplotlib画出路径

全局比对代码如下：

import matplotlib.pyplot as plt

import numpy as np

#定义全局变量列表finalList存储最后回溯的路径 finalOrder1,finalOrder2存储最后的序列 finalRoad用于存储方向路径用于最后画图

def createList():

global finalList

global finalOrder1

global finalOrder2

global finalRoad

finalList = []

finalOrder1 = []

finalOrder2 = []

finalRoad = []

#创建A G C T 对应的键值对，方便查找计分矩阵中对应的得分

def createDic():

dic = {'A':0,'G':1,'C':2,'T':3}

return dic

#构建计分矩阵

# A G C T

def createGrade():

grade = np.matrix([[10,-1,-3,-4],

[-1,7,-5,-3],

[-3,-5,9,0],

[-4,-3,0,8]])

return grade

#计算两个字符的相似度得分函数

def getGrade(a,b):

dic = createDic() # 碱基字典方便查找计分矩阵

grade = createGrade() # 打分矩阵grade

return grade[dic[a],dic[b]]

#构建得分矩阵函数参数为要比较序列、自定义的gap值

def createMark(s,t,gap):

a = len(s) #获取序列长度a,b

b = len(t)

mark = np.zeros((a+1,b+1)) #初始化全零得分矩阵

direction = np.zeros((a+1,b+1,3)) #direction矩阵用来存储得分矩阵中得分来自的方向第一个表示左方第二个表示左上第三个表示上方 1表示能往哪个方向去

#由于得分可能会来自多个方向，所以使用三维矩阵存储

direction[0][0] = -1 #确定回溯时的结束条件即能够走到方向矩阵的值为-1

mark[0,:] = np.fromfunction(lambda x, y: gap * (x + y), (1, b + 1), dtype=int) #根据gap值将得分矩阵第一行计算出

mark[:,0] = np.fromfunction(lambda x, y: gap * (x + y), (1, a + 1), dtype=int) #根据gap值将得分矩阵第一列计算出

for i in range(1,b+1):

direction[0,i,0] = 1

for i in range(1, a + 1):

direction[i, 0, 2] = 1

for i in range(1,a+1):

for j in range(1,b+1):

threeMark = [mark[i][j-1],mark[i-1][j-1],mark[i-1][j]] #threeMark表示现在所要计算得分的位置的左边左上上边的得分

threeGrade = [gap,getGrade(s[i-1],t[j-1]),gap] #threeGrade表示经过需要计算得左边左上上边的空位以及相似度得分

finalGrade = np.add(threeMark,threeGrade) #finalGrade表示最终来自三个方向上的得分

mark[i][j] = max(finalGrade) #选取三个方向上的最大得分存入得分矩阵

#可能该位置的得分可以由多个方向得来，所以进行判断并循环赋值

for k in range(0,len([y for y,x in enumerate(finalGrade) if x == max(finalGrade)])):

directionList = [y for y,x in enumerate(finalGrade) if x == max(finalGrade)]

direction[i][j][directionList[k]] = 1

return mark,direction

#回溯函数参数分别为得分矩阵方向矩阵现在所处得分矩阵的位置以及两个序列

def remount(mark,direction,i,j,s,t):

if direction[i][j][0] == 1 :

if direction[i][j-1][0] == -1: #如果该位置指向左边先判断其左边是否是零点

finalList.append(0) #如果是将该路径存入路径列表

finalList.reverse() #将列表反过来得到从零点开始的路径

index1 = 0 #记录现在所匹配序列s的位置因为两个字符串可能是不一样长的

index2 = 0 #记录现在所匹配序列t的位置

for k in finalList:

if k == 0 :

finalOrder1.append("-")

finalOrder2.append(t[index2])

index2 += 1

if k == 1 :

finalOrder1.append(s[index1])

最低0.47元/天解锁文章

weixin_39932344

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。