单倍型块( haplotype block )是连续基因组区域的一系列遗传变异位点的组合,这种基因组区域通常表现为高连锁不平衡、低重组。
但其实在育种过程中,情况可能更为复杂,我们观察到的haplotype block到底是由育种家的人工选择维持的(比如控制多性状的基因组区域,育种家会聚合多种优良的性状,从而形成单一的单倍型),还是由于该染色体区域重组率低而不易被打破,不同的研究似乎有不同的见解。有研究表明,一些聚合了多性状且形成了haplotype block的基因组区域,通过研究后代的重组自交系,表明这些haplotype blocks能够被打破 。当然,这并不能否认一些高连锁不平衡、低重组的基因组局域对维持haplotype blocks的作用,并且也确实观察到这样的现象。或许无论是人工选择还是染色体本身的生物学特性,两者并不冲突,可能在维持haplotype block均发挥了作用。
HaploBlocker是一个R包,在群体遗传分析中,用于寻找haplotype block (单倍型块)。根据官方文档,HaploBlocker包括八个部分的参数,分别为:1)Prefilters(SNP数据集的预处理),2)Cluster-building,3)Cluster-merging,4)Block-identification,5)Block-filtering,6)Block-extending,7)Off-variant-identification(optional),8)Performance parameters – computing time。
这里我们主要详细介绍前面六个部分的参数。更多详细信息请参考:https://github.com/tpook92/HaploBlocker/wiki/
1)Prefiters
Parameters: prefilter, maf, equal_remove
maf:最小等位基因频率
equal_remove:one can remove all SNPs in perfect LD to the previous one (该参数的官方文档解释,未能理解其中含义)
prefilter:默认情况下不进行SNP过滤,可通过prefilter参数进行激活
2)Cluster-bulding
Parameters: window_sequence, window_size, merging_error, max_groups, bp_map, window_anchor_gens, blockinfo_mode, at_