0.下载虚拟机
ubuntu虚拟机配置 参照:http://t.csdnimg.cn/vWgUL
。。。。。。。。
bash进入linux子系统
调整路径的方法
1. 用plink 把map和ped文件合成VCF文件
./plink --file --map All.GT.map --out test --ped All.GT.ped --recode vcf
2. pip install 下载Pyvcf包报错解决:http://t.csdnimg.cn/xHGmT
不同情况的亲本材料分离
#情况1
import pandas as pd
f1 = pd.read_csv("t1.vcf", sep="\t")
# 方法1:使用列表推导式
dh_columns = [col for col in f1.columns if col.startswith("DH")]
# 方法2:使用startswith()与apply()结合
dh_mask = f1.columns.to_series().apply(lambda x: x.startswith("DH"))
f2 = f1.loc[:, dh_mask]
f_base = f1.iloc[:, :9]
# 拼接f2与f_base
result = pd.concat([f_base, f2], axis=1).T
result.to_csv("wcy.vcf", sep="\t", index=False)
....
#情况2
import pandas as pd
f1 = pd.read_csv("t1.vcf", sep="\t")
# 方法1:使用列表推导式
dh_columns = [col for col in f1.columns if not col.startswith("DH") or col == "DH002_DH002"]
f2 = f1[dh_columns]
f2.to_csv("sby.vcf", sep="\t", index=False)
3.tassel文件处理
标记筛选 待考证...(查文献)
4.saveAs —— 保存为Hapmap格式
5.qtlMapping map文件的转化
.....