冗余分析(redundancy analysis, RDA)自己之前也听过,好像是生态学研究中用的比较多,主要是用来探索环境和一些样本指标之间的关系。最近自己在看一些群体遗传相关的内容,发现RDA也可以用在群体遗传方面
,比如这个参考链接 https://popgen.nescent.org/2018-03-27_RDA_GEA.html 就介绍了这个分析,主要研究内容自己还没有看明白:大体好像是利用芯片技术测了一些狼的基因型,同时采集了狼生活地点的环境数据,利用RDA同时分析基因型数据和环境数据。这个看的还有些模棱两可,还需要仔细看看。这个链接对应的两篇论文
找资料的时候还找到了另外一篇论文
image.png
image.png
image.png
今天的推文重复一下这个论文里的冗余分析的代码
首先是读入数据
sim1.csv这个数据集1:14列是环境数据,后面都是基因型数据
geno
env
geno[1:6,1:6]
head(env)
对基因型数据进行过滤
这里又涉及到了最小等位基因频率这个概念
MAF
<