关联分析LD计算的问题

本文探讨了连锁不平衡(LD)的衰减及其在基因组定位中的作用。通过TASSEL软件计算LD,重点关注full matrix模式,并介绍了在R中进行数据过滤、排序和窗口平均值计算的过程,以揭示LD的衰减趋势。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

说道关联分析,就要谈到连锁不平衡,连锁不平衡的衰减。 那么什么就是LD的衰减呢, 简单的说就是群体在经历了几百年或是更多年的历史重组之后在基因组上形成的重组块(block). 这些block 紧密的排列在基因组染色体的位置上。 有的地方block 比较大, 有的地方block比较小。 这个大小的意思就是延伸的长还是短。平均的延伸的长度决定了我们定位基因的精度。 延伸的越短,定位的精度越高。 延伸的越长,定位的精度越小。 我们画LD的衰减通常用tassel 软件, 或者是别的软件, 然后在进行做图计算。 大致分位一下几个步骤:

(1) 在TASSEL 中,计算LD时,会有三个选项,一个是full matrix, 一个是sliding window , 另一个是site by all . 这里我最熟悉的是full matrix 。 但是, 我们使用full matrix 的时候也有个缺点, tassel 不但计算了共线性的LD, 还计算了非共线性的LD, 大多的时候, 我们仅需要共线性的LD, 也就是一条染色体上两两位点之间的连锁不平衡大小。 当数据量比较大的时候, 最好按照染色体分开计算。 我喜欢的数据格式是hapmap.

(2)在进行计算之前,要进行位点的过滤。 选择 sites,MAF=0.05,remove indels,计算时选取为fullmatrix模式,这样计算的结果就是 同一条染色体上量位点的

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值