PopLDdecay画连锁不平衡LD学习笔记,1.5版本

参考文章:

LD衰减图的理解与应用 - 简书 (jianshu.com)

 连锁不平衡LD (popLDdecay+ LDBlockShow) - 知乎 (zhihu.com)

1.下载安装

网上有比较详细的教程,直接搜索。开始下载前,这是我截屏做的笔记,

之后就可以直接安装了

git clone https://github.com/BGI-shenzhen/PopLDdecay.git
chmod 755 configure;
./configure;
make;
mv PopLDdecay  ./bin/;

但是这个我解压不了,不过你们可以试试

我用的是

tar-zxvf  PopLDdecayXXX.tar·gz
cd PopLDdecayXXX;
cd src;
make;

众所周知,我的Ubuntu被我卸载了重新安装了,然后第二次下载的时候报错, 

解决办法是sudo apt-get install zlib1g-dev

注意,可以在当前目录下直接输入PopLDdecay或则是../bin/PopLDdecay,也可以是./bin/PopLDdecay,看你们的电脑那个可以,得到下面就说明下载成功

2.画图

可以需要在PopLDdecay文件下直接创建文件夹,

参考文章PopLDdecay 中文使用手册 - 知乎 (zhihu.com)

多个群体

有两个文件名列表,如wildName.list文件存wild1, wild2, wild3…wild25的名字,而culName.list存cul1, cul2, cul3…cul25

两步搞定,但是这个地方可能报错,因为我没设置环境变量,但只要正确路径就行

两步代码根据实际情况使用就行, 

$ PopLDdecay -InVCF  ~.vcf  -OutStat subA_LDdecay  -SubPop subA.txt

$ PopLDdecay -InVCF  ~.vcf  -OutStat subB_LDdecay  -SubPop subB.txt

在你新建的文件夹下面,可以直接创建一个Pop.txt,包含两列,第一列为LD decay文件的路径,第二列为亚群的图例。在Pop.txt里面编辑

  1. Multi.list 文件格式共有两列,第一列为文件路径,第二列是群体ID的Flag. The format of <Multi.list> had two columns , the file path of population result and the population flag
/your/path/subA_LDdecay.stat.gz subA
/your/path/subB_LDdecay.stat.gz subB

绘制图,得出结果

$ perl ../Plot_MultiPop.pl  -inList  Pop.txt -output sub_Fig

上面是多个的,第二次跑我的数据不够完整,我只跑了一个的

bin/PopLDdecay -InVCF 12.vcf -OutStat Sub1_LDdecay -SubPop 2.txt

根据提示来,报错,

这个地方可能需要再次注意一下,时间问题,下次再弄两个图。

  

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
LDSC算法的详细代码实现相对复杂,需要掌握基础的遗传学和统计学知识。以下是LDSC算法的主要步骤和相应的代码实现: 1. 数据预处理:需要对GWAS数据进行预处理,包括对SNP位点进行过滤,计算每个SNP位点的调和信息熵(harmonic information entropy)以及计算每个SNP位点的LD score。这一步骤可以使用LDSC软件包中的预处理工具。 2. 构建回归模型:使用预处理后的数据,建立回归模型来评估不同遗传变异对复杂性状的贡献。具体来说,可以使用线性回归模型来建立关于SNP位点的Z统计量与LD score之间的关系,从而估计每个SNP位点的效应大小。这一步骤可以使用LDSC软件包中的回归模型工具。 3. 计算遗传相关性:计算不同SNP位点之间的遗传相关性,即连锁平衡LD)程度。可以使用PLINK等软件包来进行计算。 4. 评估基因组区域的遗传贡献:使用上述步骤得到的结果,可以评估整个基因组区域的遗传贡献,从而鉴定潜在的生物学机制。 下面是伪代码实现LDSC算法的主要步骤: ``` # 数据预处理 data = preprocess(data) # 构建回归模型 model = regression_model(data) # 计算遗传相关性 ld = calculate_ld(data) # 评估基因组区域的遗传贡献 contribution = evaluate_contribution(model, ld) ``` 需要注意的是,以上代码仅为伪代码,具体实现需要根据具体情况进行调整和修改。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值