Plink常用命令总结

最新推荐文章于 2024-08-21 08:25:34 发布

Taylent

最新推荐文章于 2024-08-21 08:25:34 发布

阅读量2.5w

收藏 139

点赞数 12

分类专栏：医学影像&生物信息文章标签： Plink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Taylent/article/details/102523295

版权

医学影像&生物信息专栏收录该内容

8 篇文章 24 订阅

订阅专栏

文章目录

附

一、基本操作

2020/05/06 更新
补充一下Plink相关的几种数据格式，见下图（图片来源忘记了，在整理文档时看到就插了进来）。

在这里插入图片描述

1、–bfile 、 --file 和 --tfile

读取文件

–bfile 读取二进制文件，bed、bim和fam格式
–file 读取文本文件，ped和map格式
使用以上两个命令时，文件命名要一致，如test.bed、test.bim、test.fam
二进制文件比较小，处理速度比较快

2、–out

指定输出文件的名称

3、–recode、 --make-bed 和 --transpose

格式转换

（1）PED/MAP 转换为TPED/TFAM格式：

plink --ped test.ped --map test.map  --recode --transpose --out test1

或者

plink --file test --recode --transpose --out test1

（2）TPED/TFAM转化为PED/MAP文件：

plink --tped test1.tped --tfam test1.tfam  --recode --out test2

或者

plink --tfile test1 --recode --out test2

（3）PED/MAP转为二进制格式

plink --file test --make-bed --out test3

（4）TFAM/TPED转为二进制格式

plink --tfile test1 --make-bed --out test3

（5）二进制格式转为TPED/TFAM：

plink --bfile test3  --recode --transpose --out test4

（6）二进制格式转为PED/MAP：

plink --bfile test3 --recode --out test

4、–keep 和 --remove

保留或删除指定的样本
keep为保留，remove为删除

（2020.12.08更新，附加一些说明）
下面这条命令中的sampleID.txt由两列构成，第一列为提取的样本Family ID，第二列为Within-family ID（IID）。

plink --bfile test --keep sample.txt --recode --make-bed --out sample

5、–extrac

保留指定的SNPs

（2020.12.08更新，附加一些说明）
下面这条命令中的snp.txt由一列构成，该列为SNP ID，每行为一个SNP位点。

plink --bfile test --extract snp.txt --make-bed --out snp

二、质量控制

1、–geno

2、–hwe

3、–maf

4、–mind

一行命令完成质量控制：

plink --bfile test --geno 005 --hwe 0.000001 --mad 0.5 --mind 0.1 --make-bed --out test_qc1

2020/05/06 更新
最近把质量控制部分又展开写了写，详细可参看
使用Plink对SNP数据进行质量控制

三、编码

1、–recode vcf

默认输出文件格式为vcf（废话）
输出文件每行是一个SNP，表示形式如 0/1，缺失为NA

2、–recode 12

默认输出文件格式为ped和map
输出文件每行是一个样本
A1编码为1，A2编码为2，两位代表一个SNP位点，强制使用 --missing-genotype来定义缺失基因的编码形式

3、–recode 23

默认输出文件格式暂时不知道，没使用过
因为需要配合其他命令使用

4、–recode AD 和 --recode A

默认输出文件格式为raw，R语言可读
使用0，1，2进行编码，AD还包含dominant项（het为1，其他为0），AD每个SNP编码为两位，A为一位

以上命令均基于Plink1.90。

附

（2020.12.08更新，增加链接一条）

上文中只介绍了Plink格式文件的相互转化，在基因组数据中还有一种很常见的文件格式——vcf，下面链接介绍了三种vcf格式转为Plink格式的方法，其中有一种方法是利用Plink命令来转。

http://www.360doc.com/content/19/1224/13/68068867_881784697.shtml

参考：
http://www.cog-genomics.org/plink2/

Taylent

关注

12
点赞
踩
139

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Taylent

博客等级

码龄6年

23
原创

114
点赞

666
收藏

90
粉丝

关注

私信

热门文章

分类专栏

最新评论

手把手式介绍 ADNI 影像数据下载
DoReMiiiiFa: 请问一下登录之后点击数据又疯狂跳转回去了，网站是不是有什么问题呀
利用Pytorch写多分支网络的一些想法
coke63: 谢谢
利用Pytorch写多分支网络的一些想法
Taylent: 我个人理解你的模型相当于先提取公共特征，然后再多个分支分别提取和任务相关的深层特征，这种模型搭建方式是没问题的。权重文件很大这个问题一方面是多个分支必然会增加参数量（可能是多个下游任务的全连接层带来的，也可能是多个分支导致共享参数变少带来的）；另一方面可以粗略估算一下参数量（毕竟这种搭建方式相当于两个模型只有一部分参数共享，理论上参数量应该介于1个resnet和2个resnet之间），然后再考虑权重文件的大小是否是异常。
利用Pytorch写多分支网络的一些想法
coke63: 博主你好，使用resnet模型对图片进行分类，在最后池化层前加入卷积对不同任务的分类进行分支的搭建，这种方式可行吗，我训练出来的权重文件很大
手把手式介绍 ADNI 影像数据下载
普通网友: 想请教大家申请后官方给了链接，但还是登录不了

最新文章

2021年2篇

2020年13篇

2019年10篇

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值