群体遗传 | haplotype block | HaploBlocker使用

___后知后觉

已于 2022-03-25 13:37:59 修改

阅读量1.2k

点赞数 2

分类专栏：群体遗传文章标签：经验分享

于 2022-03-25 12:10:33 首次发布

本文链接：https://blog.csdn.net/yinm2021/article/details/123730580

版权

本文分享了使用HaploBlocker进行群体遗传研究中haplotype block分析的经验，详细阐述了所需输入文件的准备，如SNP矩阵和位置文件，并解读了软件参数的重要性和设置，旨在为后续的进化起源追溯和GWAS分析奠定基础。

摘要由CSDN通过智能技术生成

HaploBlocker是分析单条染色体haplotype blocks，这也很容易理解，haplotype block是同一条染色体的某些区域。因此，分析时，需要按染色体或者Scaffold切分VCF文件。

准备HaploBlocker的准备文件，以Chr1为例。这里主要需要两个输入文件：

1）chr1.vcf_forR

该文件为SNP矩阵，行代表SNP位点，列代表样本。换句话说，就是不包含头信息和前9列信息的VCF文件，然后转化成下面这种格式。（想必大家应该能明白）

cut -f 1-10  chr1A_merged.vcf_forR | head -n 10 #显示前10列和前10行

T	X	X	X	T	T	C	C	C	C
T	T	T	T	T	T	C	T	C	C
X	X	X	C	C	X	C	C	X	C
G	H	G	G	G	G	G	G	G	G
A	H	A	A	A	A	A	A	G	G
G	G	G	G	G	G	X	G	A	H
G	G	G	G	G	G	G	G	G	G
G	G	G	G	G	G	G	G	G	G
X	T	T	T	X	T	X	X	X	T
C	C	C	C	C	C	C	C	C	X

在这里，我将杂合位点设置为H，将空值设置为X。如果不考虑空值和杂合位点，则将其设置为NA。

空值的原因有很多：①可能是未能检测到该样品的该位点信息，②也可能是由于该样本的该位点的缺失