GWAS - plink介绍与安装(Mac)

此教程写给像博主一样的小白,欢迎各路大神批评指正

GWAS

GWAS全称“全基因组关联分析”,使用统计模型找到与性状关联的位点,用于分子标记选择(MAS)或者基因定位。
简单来讲,就是找出基因中哪些序列变异(SNP)与疾病相关。即就是统计一个数,找出与表型最有显著性意义的那些基因(位点)。分析方法有:逻辑回归(表型数据为二元);线性回归(表型数据为连续性变量);表型数据正态分析(如果不是正态分布,需转换处理为正态分布)。

R包、plink和EMMAX都可以做GWAS,但是据说后两者做GWAS更快,更容易写出pipeline。以及实验室师兄师姐均采用plink,因此选择学习这个工具。
#plink介绍
PLINK是一个免费的开源全基因组关联分析工具集,在SNP数据统计,过滤,GWAS分析中都可以用得上,而且计算速度很快。直接去百度上搜索plink就可以很容易就找到plink官网(http://www.cog-genomics.org/plink2)功能大概有以下几种:

  • 数据管理: SNP数据格式的转换,合并两个或多个文件,提取SNP子集,以二进制文件格式压缩数据等。
  • 质量控制的SNP数据统计: 计算丢失基因型率,等位基因,基因型频率,HWE测试,个体和个体对的近亲繁殖,IBS和IBD统计,LD区域计算等。
  • GWAS关联分析
  • Meta分析
    #plink下载
    官网现在更新呦plink1.9与plink2.0版本,可以根据自己需要下载,我选择的是1.9 stable版本。
    plik下载方便,只要找到相应的系统的版本就可以进行下载了,下载链接地址为:http://www.cog-genomics.org/plink2/下载完解压即可立即使用。

此时在终端中直接输入plink不可行哦
电脑会告诉你没有plink这个命令-bash: plink: command not found


  • 使用方法(mac版)
    打开terminal,cd到解压到的文件夹(把plink拖入终端即可)
    测试安装成功
    之后每次使用需要cd到此路径,输入./plink再输入参数,如:
./plink --help
./plink --vcf Arab.vcf --allow-extra-chr --maf 0.05 --recode --out Arab
  • 若需要在终端中直接调用plink,则需要把plink写入全局路径
vim .bash_profile
#然后按i键进入编辑模式,输入以下语句,其中路径为解压plink的文件夹路径
export PATH=/Users/limingzhu/Downloads/plink_mac_20200428:$PATH
#输完后回车,按ESC
 :w  #表示保存
 :q #表示退出
source .bash_profile  #更新即可

之后即可在终端中直接调用plink命令啦!!冲鸭!

评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值