plink常用文件格式转换

#map/ped文件#

  • map文件

记录变异位置信息

第一列  染色体编号

第二列 SNP名称

第三列 遗传距离

第四列 snp物理位置

  • ped文件

第一列 家系编号                                   第二列 个体编号

第三列 父本                                          第四列 母本

第五列 性别                                          第六列 表现型

第七列往后 每个SNP位点基因型

第七列第八列是第一个基因型

#二进制格式 bed / bim / fam #

  • bed文件

SNP数据,是二进制格式,不能由Notepad++等文本编辑器打开

  • bim文件

SNP位置信息

第一列 染色体编号                                                第二列 SNP名字

第三列 遗传距离                                                   第四列 物理距离

第五列 次要等位基因(minor allel)                    第六列 主要等位基因(major allel)

  • fam文件

家系表型信息

第一列 FID                       第二列 IID                             第三列 父本

第四列 母本                      第五列 性别                          第六列 表型

# 转置格式tped / tfam 文件#

  • tped文件

前四行 = map文件

后面代表所有样本在该snp位点基因型信息

  • tfam文件

= ped文件1~6列

#plink文件格式相互转换#

  • 将map/ped文件转化为二进制文件

plink --file GENO --make-bed --out geno
  • 将tped/tfam文件转化为二进制文件

file变为tfile

结果:

  • 将ped/map文件互相转化tped/tfam

# map/ped转tped/tfam # 
plink --file GENO --recode --out GENO
# tped/tfam转map/ped #
plink --tfile GENO --recode --transpose --out GENO
  • 将二进制文件转化为map/ped

plink --bfile geno --recode --out GENO
  • 将二进制文件转化为tped/tfam

recode后加transpose

  • 二进制文件转化为vcf

plink --bfile geno --recode vcf --out geno --chr-set 27
  • 二进制文件转化为bgen

plink --bfile geno --recode bgen --out geno
  • vcf文件转化成map/ped

plink --vcf geno.vcf --recode --out geno

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值