酷狗格式转换读取文件失败_一文掌握Plink文件格式转换

欢迎关注微信公众号"生信小王子"!

Plink是我们常用的全基因关联分析工具,具有多种文件格式。许多分析工具都需要Plink的文件格式作为输入文件,今天小编就带大家掌握多种Plink文件格式的转换,解决分析过程中遇到的输入文件问题。

## 下载Plink
wget -c http://s3.amazonaws.com/plink1-assets/plink_linux_x86_64_20200219.zip
## 解压
unzip plink_linux_x86_64_20200219.zip

vcf 转为 ped/map

## 使用vcftools
vcftools --vcf snp.vcf --plink --out snp
## 使用plink
plink --vcf snp.vcf --recode --out snp

ped和map文件是Plink的基本格式。

ped文件包含以下几列:

第一列:Family ID。

第二列:Individual ID。自然群体这列和Family ID是一样的。

第三列:Paternal ID。未提供信息的话这列为0。

第四列:Maternal ID。未提供信息的话这列为0。

第五列:Sex。未提供信息的话这列为0。

第六列:Phenotype。一般来说,直接拿vcf转换的话这列为-9,也就是缺失。

第七列开始就是个体在每个标记位点的基因型。

map文件包含以下几列:

第一列:染色体编号。

第二列:SNP编号。

第三列:遗传距离。未提供信息的话这列为0。

第四列:物理位置。

ped/map 与 tped/tfam 格式互换

## ped/map转换为tped/tfam
plink --file snp --recode --transpose --out snp_test
## tped/tfam转换为ped/map
plink --tfile snp_test --recode --out snp

ped/map 与 bed/bim/fam互换

## ped/map转换为bed/bim/fam
plink --file snp --make-bed --out snp_test
## bed/bim/fam转换为ped/map
plink --bfile snp_test --recode --out snp

tped/tfam 与 bed/bim/fam互换

## tped/tfam转换为bed/bim/fam
plink --tfile snp --make-bed --out snp_test
## bed/bim/fam转换为tped/tfam
plink --bfile snp_test --recode --transpose --out snp

bed/bim/fam 转为 vcf

## bed/bim/fam 转为 vcf
plink --bfile snp --export vcf --out snp_test

常用的Plink格式转换就是这些,大家可以根据自己实际需要相互转换。

参考资料:

http://www.cog-genomics.org/plink/1.9/formats

https://www.jianshu.com/p/286050959dbd

https://www.jianshu.com/p/f7bbd57ccafd

生物信息学入门推荐书籍:

5add89d1a9dd7f8576fa25abaff86912.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值