基因芯片原始数据处理

0.下载虚拟机

ubuntu虚拟机配置 参照:http://t.csdnimg.cn/vWgUL

。。。。。。。。

bash进入linux子系统

调整路径的方法 

1. 用plink 把map和ped文件合成VCF文件

./plink --file --map All.GT.map  --out test   --ped All.GT.ped   --recode vcf

2. pip install 下载Pyvcf包报错解决:http://t.csdnimg.cn/xHGmT

不同情况的亲本材料分离
 


#情况1
import pandas as pd

f1 = pd.read_csv("t1.vcf", sep="\t")

# 方法1:使用列表推导式
dh_columns = [col for col in f1.columns if col.startswith("DH")]

# 方法2:使用startswith()与apply()结合
dh_mask = f1.columns.to_series().apply(lambda x: x.startswith("DH"))
f2 = f1.loc[:, dh_mask]

f_base = f1.iloc[:, :9]

# 拼接f2与f_base
result = pd.concat([f_base, f2], axis=1).T

result.to_csv("wcy.vcf", sep="\t", index=False)

....
 


#情况2
import pandas as pd

f1 = pd.read_csv("t1.vcf", sep="\t")

# 方法1:使用列表推导式
dh_columns = [col for col in f1.columns if not col.startswith("DH") or col == "DH002_DH002"]
f2 = f1[dh_columns]


f2.to_csv("sby.vcf", sep="\t", index=False)

3.tassel文件处理

标记筛选 待考证...(查文献)

4.saveAs —— 保存为Hapmap格式
 

5.qtlMapping map文件的转化 
.....

  • 8
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值