gwas_表型处理

最新推荐文章于 2024-09-08 11:13:35 发布

生信学习小达人

最新推荐文章于 2024-09-08 11:13:35 发布

阅读量1.7k

点赞数 1

分类专栏： gwas 文章标签：学习方法 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hgz2020/article/details/129424628

版权

gwas 专栏收录该内容

9 篇文章 1 订阅

订阅专栏

获得精确的表型后，我们需要对表型进行处理，例如：

（1）去除异常值：防止由于异常值的存在导致假阳性关联偏高，尤其是极端异常值会导致全局的“假阳性”出现。方法：1）排序观察法；2）3sigma规则，即数据处于mean值加减3倍标准差范围保留，否则去除；3）箱线图法，即在箱线图触须外的均判定为异常值

（2）进行正态分布检验：关联模型（GLM\MLM）是线性模型，而线性模型要求数据符合正态分布。利用R语言中的函数shapiro.test(),方法选择shapiro-wilk

（3）格式转换：质量性状（花色为红色，转换成0,1，0代表非红色，1代表红色，主要比例不要相差太悬殊），分级性状（抗病性，转为0、1、2,0代表高感，1为中抗，2为高抗）

（4）当代性状和后代性状的处理

多年多点的数据处理：

包括相同年份不同地点，及不同年份的相同（或不同）地点的数据

1）若性状遗传力高，受环境影响小，则将多年多点的数据结果取均值，或者计算出BLUP值作为改性状值

2）若性状遗传力低，受环境影响大，则每年每点的数据的单独分析综合评判其结果，获的关联结果的同时进行GXE分析

数据标准化

当数据的绝对值比较大且具有明显间隔梯度时需要进行标准化处理，方法如下：

1）数据中心化：z-score: $\text{[math]}$

2) min-max法：离差标准化，归一化（0-1之间）

$\text{[math]}$

表型的基本分析

1）描述性统计分析：极大值，极小值，均值，方差，变异系数，偏度，峰度

2）质量性状或者分级性状的赋值处理

3）相关性分析：相关性高的性状，可能受同一个基因控制，也可能是控制不同性状的基因间的互作（绘制成图片形式较美观）

4）主成分分析

5）聚类分析

生信学习小达人

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。