Python pandas 单条 染色体体 位置 区间 SNP 数据 提取 haploview

import pandas as pd

sheet1 = pd.read_excel('C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\chrom 1\\chrom1_map.xlsx')
sheet1
print(type(sheet1))
sheet1.dtypes

#传入SNP的postion,并提取SNP位点信息
pos = 315320300
type(pos)
data10 = sheet1[ sheet1['4'] > (pos-500000)]
data11 = data10[ data10['4'] <(pos + 500000)]
data11
data11.shape
data12 = data11.drop(['1', '3'], axis=1)
data11.shape
data12

#output map.txt
data12.to_csv("C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\chrom 1\\chrom1_test_map.csv", sep = '\t', index = False, header = False)

#提取SNP位点信息的SNPname,并生成列表
data12 = data11.iloc[:, 1]
data12
type(data12)
data13 = data12.tolist()
len(data13)

#按照SNPname提取ped文件中的目标碱基队列
sheet2 = pd.read_excel('C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\chrom 1\\chrom1_snp.xlsx')
sheet2
sheet2.columns
data20 = sheet2.iloc[:, :6]
data20
data21 = sheet2.iloc[:, 6:]
data21

for i in data13:
    data20 = pd.concat([data20, data21[i]], axis =1)  
    data20 = pd.concat([data20, data21[i + str('.1')]], axis =1)  #由于列名重合,对重合列的提取

data20.head(20)
data20.columns
data20.shape
data20

#output snp.txt
data20.to_csv("C:\\Users\\windows10\\Desktop\\Python练习\\文本流\\chrom 1\\chrom1_test_snp.csv", sep = '\t', index = False, header = False)
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Bio Coder

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值