大豆SNP定位加上选择序列

"""
作者:Kocher
时间:2020,9,27,11:02
coding = "utf - 8"
CSDN首发
"""



from time import perf_counter
import csv
import time


start  = perf_counter()
f = open("GM18.txt" , "r")
txt = f.read()
txt = txt.strip(">Gm18")
txt = txt.strip("\n")
txt = txt.strip("\r")
txt = txt.strip("")      #注意这个地方有错误就是开头的第一个字符串是1,而不是我们熟悉的0

aimseq = input("请输入你想查找的DNA序列文件(回车结束):")
def indexstr(str1,str2):
    '''查找指定字符串str1包含指定子字符串str2的全部位置,
    以列表形式返回'''
    lenth2=len(str2)
    lenth1=len(str1)
    indexstr2=[]
    i=0
    while str2 in str1[i:]:
        indextmp = str1.index(str2, i, lenth1)
        indexstr2.append(indextmp)
        i = (indextmp + lenth2)
    return indexstr2



if __name__ == '__main__':
    print(indexstr(txt,aimseq))
    pos = indexstr(txt,aimseq)
#     def getseq():
    num = len(aimseq)
    for number in pos:
        if num == 45:
            sequence1 = txt[number - 300 : number]
            sequence2 = txt[number + 45 : number + 345]
        elif num == 50:
            sequence1 = txt[number - 300 : number]
            sequence2 = txt[number + 50 : number + 350]
        print("由以上条件我们可以得知前300个碱基为 {} ,后300个碱基为 {} ".format(sequence1,sequence2))

    print("此次查找花费的时间是:{:.5f} 秒".format(perf_counter() - start))

        
    c= open ("SNP相关数据.csv","w+")
    writer=csv.writer(c)
    datalist = []
    datalist.append(aimseq)
    time.sleep(0.1)
    datalist.append(sequence1)
    time.sleep(0.1)
    datalist.append(sequence2)
    time.sleep(0.1)
    for numbers in pos:
        datalist.append(numbers)
    time.sleep(0.1)
    writer.writerow(["SNP","前300个碱基","后300个碱基","所在位置"])
    writer.writerow(datalist)
    c.close()
  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

终是蝶衣梦晓楼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值