GWAs——全基因组关联分析三(关联分析)

该博客详细介绍了全基因组关联分析(GWAS)的关联分析、统计学检验和结果可视化三个主要步骤。在关联分析部分,讨论了使用PLINK的‘--assoc’和‘--logistic’选项进行回归分析,特别强调了‘--assoc’适用于数量性状。在统计学检验中,涵盖了P值校准和置换检验。最后,提到了如何通过R脚本绘制Manhattan图和QQ图以可视化结果。
摘要由CSDN通过智能技术生成

经过前面七步的质控,现在的数据集(Table 1)已经可以正式的开始关联分析的主要步骤了。

Table 1:进行关联分析的数据集。

文件名 内容信息
HapMap_3_r3_13.bed 实验所有个体及对照的基因型信息
HapMap_3_r3_13.fam 个体及对照的谱系关系、性别和表型信息
HapMap_3_r3_13.bim SNPs的位置信息
covar_mds.txt MDS生成的10个协变量

此步骤主要包括三个内容:关联分析统计学检验结果可视化

一、关联分析

1、搭建工作环境

为了和文章结构保持一致,将工作目录做如下修改:

cd /{
   your directory}/GWAs/
#修改分析主工作目录名
mv 3_Association_GWAS/ 2_Association_GWAS/
cd 2_Association_GWAS/
#创建关联分析工作目录
mkdir assoc

#置入数据集和协变量
mv /{
   your directory}/GWAs/1_QC_GWAS/pop_str/covariates/HapMap_3_r3_13.* assoc/
mv /{
   your directory}/GWAs/1_QC_GWAS/pop_str/covariates/covar_mds.txt assoc/

2、回归分析

此次示例的数据集以二进制的分类性状为例,文章中介绍既可使用Logistic回归(“–logistic”选项),又可以使用“–assoc”选项提供的回归方式,但是在PLINK官网中介绍,此选项是针对数量性状(QTL)的回归方式(“–assoc”选项),这点不是很理解

(1)使用“–assoc”选项进行回归

此方法不支持在过程中引入协变量:

cd assoc
#使用“--assoc”选项进行回归
/{
   your directory}/GWAs/plink-20220402/plink --bfile HapMap_3_r3_13 --assoc --out assoc_results

输出结果assoc_results.assoc各列对应的含义见Table 2:

Table 2: assoc_results.assoc中包含的列,更多信息见官网

列名 含义
CHR 染色体编号
SNP SNPs编号
BP 碱基对位置
A1 Allele 1(一般为次等位基因)
F_A 案例中的Allele 1频率
F_U 对照中的Allele 1频率
A2 Allele 2
CHISQ 等位基因检验的卡方统计量(chi-squre statistic,Not present with ‘fisher’/‘fisher-midp’ modifier.)
P 等位基因检验的P值,对应卡方统计量
OR o d d s c a s e A 1 / o d d s c o n t r o l
  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Odd_guy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值