pythonnet plink_群体遗传结构构建软件--Plink, admixture, phylip, MEGA总结

本文介绍了如何利用Plink进行PCA分析,Admixture进行祖先推断,以及使用phylip和MEGA构建进化关系。通过交叉验证确定Admixture的最优K值,并通过不同方法对样本进行分类,得出群体遗传结构。
摘要由CSDN通过智能技术生成

开始正文之前先了解一下为什么构建群体遗传结构是重要的,并且可以通过哪些方式构建此结构:

对于方法1,我们需要使用Plink构建PCA图

(1) 首先使用plink将vcf格式文件转换成.bed , .bim , .fam文件, 操作如下:

plink --allow-extra-chr -vcf XXX.vcf --make-bed --out filtered_XXX && echo "vcf2bed is done"

(2) 使用plink进行主成分分析,操作如下:

plink -bfile filtered_XXX --allow-extra-chr --pca 10 --out PCA_filtered_snps

产生了两个eigenval eigenvec文件,之后开始绘制PCA散点图,可以使用python脚本进行绘制,代码如下:

#!/usr/bin/python

# -*- coding: UTF-8 -*-

'''绘制PCA散点图'''

import matplotlib.pyplot as plt

import collections

import re

hash = collections.OrderedDict()

eval_file = open("PCA_filtered_snps.eigenval","r")

evec_file = open("PCA_filtered_snps.eigenvec",

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值