PLINK-GWAS学习4------数据质控之过滤稀有突变

前言
根据MAF筛选SNP,对于常见的表型,稀有突变的作用一般较小,同时如果针对稀有突变进行选育或者研究时需要最小等位基因需要足够的个体数,那么这就需要有足够大的抽样群体,费时费力。同时稀有突变是由于基因型检测的错误导致的可能性更大。稀有突变一般在疾病中的研究比较多。
首先去除性染色体上的SNP,人的常染色体为1-22,使用以下代码即可将常染色体的SNP提取出来。

awk '{ if ($1 >= 1 && $1 <= 22) print $2 }' HapMap_3_r3_6.bim > snp_1_22.txt

q常染色体一共有1398544个SNP(注意:这是经过SNP缺失质控后剩余的常染色体SNP数)

plink --bfile HapMap_3_r3_6 --extract snp_1_22.txt --make-bed --out HapMap_3_r3_7

在这里插入图片描述
在这里插入图片描述

plink --bfile HapMap_3_r3_7 --freq --out MAF_check

在这里插入图片描述在这里插入图片描述

less MAF_check.frq

在这里插入图片描述
第一列是染色体号,第二列是SNP名,第三列和第四列是等位基因,第五列是次等位基因频率,第六列Number of allele observations(等位基因观察数)。

去除MAF小于0.05的位点

plink --bfile HapMap_3_r3_7 --maf 0.05 --make-bed --out HapMap_3_r3_8

在这里插入图片描述
在这里插入图片描述

可视化
前面统计的SNP频率可以通过R代码进行可视化,
在这里插入图片描述在这里插入图片描述在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值