什么是GWAS全基因组关联分析？

生信分析笔记

已于 2025-01-06 21:51:28 修改

阅读量7.3k

点赞数 20

文章标签：后端

于 2024-09-13 16:27:18 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ZaoJewin/article/details/142214167

版权

什么是全基因组关联分析？（Genome-Wide Association Study，GWAS）

全基因组关联分析（GWAS）是一种在全基因组范围内搜索遗传变异（通常是单核苷酸多态性，SNP）与复杂性状之间关联的方法。

其核心思想是通过比较群体中不同个体的基因型与表型，识别出与目标性状显著相关的基因位点。GWAS基于连锁不平衡（LD）的原理，即相邻的遗传变异倾向于一起遗传，因此可以通过标记SNP间接捕获致病变异。

GWAS的应用场景

复杂性状解析：用于揭示控制复杂农艺性状（如产量、品质、抗病性等）的遗传基础，探索遗传学机理。
疾病抗性研究：发现与植物病害抗性相关的基因，为育种提供候选基因，其他性状也以此类推。
分子育种：辅助分子标记辅助选择（MAS）和基因组选择（GS）。

数据分析过程与原理

表型数据收集：精确、可靠的表型测定是关键。需在多环境、多重复下评估表型特征等数据，以减少环境误差。

基因型数据获取：利用SNP芯片或高通量测序技术获取全基因组SNP数据。

数据质量控制（QC）

标记过滤：删除缺失率高、次等位基因频率（MAF）低、偏离哈迪-温伯格平衡的SNP。
个体过滤：剔除基因型缺失率高或有杂合度异常的个体。

群体结构和亲缘关系分析

主成分分析（PCA）：识别和校正群体结构。
STRUCTURE或ADMIXTURE分析：确定群体的组分。
亲缘关系矩阵（Kinship Matrix）：估计个体间的亲缘关系。

关联分析模型构建

一般线性模型（GLM）：y=Xβ+ϵ

y：表型值向量
X：基因型矩阵

最低0.47元/天解锁文章

生信分析笔记

博客等级

码龄3年

R语言领域新星创作者

143
原创

724
点赞

2070
收藏

1万+
粉丝

关注

私信

热门文章

最新评论

R语言绘制动态网络图Network教程WGCNA
peacemiusone: 1034739216@qq.com
快速从fasta序列文件中提取指定序列的方法
宋兆霖: 我用seqkit提取完之后，output里什么也没有是咋回事？[图片]
GO富集绘图绘制方法，零基础教程，替换数据直接作图，完成版R语言脚本
evansunzn: 大佬，表里的number是哪个数据哇
最新版samtools安装与使用方法
weixin_41796802: make编译时出现错误， cd htslib-1.20 && make htslib.pc.tmp make[1]: 进入目录“/home/kexin/software/samtools-1.20/htslib-1.20” config.mk:2: *** Resolve configure error first。停止。 make[1]: 离开目录“/home/kexin/software/samtools-1.20/htslib-1.20” config.mk:46: htslib-1.20/htslib_static.mk: 没有那个文件或目录 make: *** [htslib-1.20/htslib.mk:186：htslib-1.20/htslib.pc.tmp] 错误 2 (base) root@hw-RH5885-V3:/home/kexin/software/samtools-1.20#这个怎么解决呢？
最新版samtools安装与使用方法
weixin_41796802: 我也是在make的时候出现了错误，请问你解决了吗？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

生信分析笔记 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。