hwe-哈温质控

1.什么是哈温平衡?

哈迪-温伯格(Hardy-Weinberg)法则是群体遗传中最重要的原理,它解释了繁殖如何影响群体的基因和基因型频率。这个法则是用Hardy,G.H(英国数学家) 和Weinberg,W.(德国医生)两位学者的姓来命名的,他们于同一年(1908年)各自发现了这一法则。他们提出在一个不发生突变、迁移和选择的无限大的相互交配的群体中,基因频率和基因型频率将逐代保持不变。

2.怎么做哈温平衡质控?

将观察数(O)与预期值(e)作比较,进行χ2检验。处理组和对照组的基因型分布的观察值和预期值差异无显著性(P>0.05),符合遗传平衡定律。

3.哈温平衡和MAF的区别?

哈温平衡是对基因频率(A,T)进行质控,而MAF是对基因型频率(AA,AT,TT)进行过滤.

4.计算HWE值

1)计算所有SNP位点的哈温平衡的P值

 查看plink.hwe文件

 plink.hwe的数据格式:
• CHR 染色体
• SNP SNP的ID
• TEST 类型
• A1 minor 位点
• A2 major 位点
• GENO 基因型分布:A1A1, A1A2, A2A2
• O(HET) 观测杂合度频率
• E(HET) 期望杂合度频率
• P 哈温平衡的卡方检验P-value值

2)剔除SNP中不符合HWE的位点

 /d/软件集合/plink/plink --bfile maf --hwe 1e-4 --make-bed --out hwe

 5.利用R语言可视化

hwe <- read.table(file = "plink.hwe",header = T)
> head(hwe)
  CHR       SNP  TEST A1 A2    GENO O.HET. E.HET.      P
1   1 rs3131972   ALL  A  G 2/33/77 0.2946 0.2758 0.7324
2   1 rs3131972   AFF  A  G 1/19/36 0.3393 0.3047 0.6670
3   1 rs3131972 UNAFF  A  G 1/14/41 0.2500 0.2449 1.0000
4   1 rs3131969   ALL  A  G 2/26/84 0.2321 0.2320 1.0000
5   1 rs3131969   AFF  A  G 1/17/38 0.3036 0.2817 1.0000
6   1 rs3131969 UNAFF  A  G  1/9/46 0.1607 0.1771 0.4189
> pdf(“hwe of distribution)
Error: unexpected input in "pdf(“"
> pdf("hwe of distribution")
> hist(hwe[,9],main = "hwe distribution")
> dev.off()
null device 
          1 

P值越低(P<0.05) ,则表明观察值(O)与预测值(E)差异越显著,则越不符合hwe平衡,需将这些位点删除。

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值