在分析全外数据的时候,无论是在样本鉴定还是CNV分析的过程中,都需要对样本进行性别判断,那么我们如何对WES数据进行性别判断那?
一、性别判断思路
对于WES数据,个人认为性别判断主要有三个思路:
1、根据Y/X染色体的reads比,这个最好理解,男性的Y/X染色体的reads比会显著大于女性的;
2、根据X染色体上SNP的杂合比例,由于女性有两条X染色体,所以女性X染色体SNP的杂合位点的比例会显著大于男性;
3、根据SRY基因,男性的SRY基因上有reads覆盖,而女性没有。
当然,以上的三种方法使用的前提是样本没有性染色体大片段拷贝数异常,比如患有特纳综合征或者克氏综合征的样本用到以上的一些方法可能会出现问题。
基于以上思路我们可以自己写脚本进行性别判定,如果您不会写脚本也没有关系,有很多开源的软件可以实现这个功能。
二、性别判定软件
今天给大家分享的是ngs-bits下的一个工具SampleGender,使用方法如下:
SampleGender -in test.bam -method xy
SampleGender -in test.bam -method hetx
SampleGender -in test.bam -method sry
-in:输入bam文件;
-method:性别判定的方法,xy、hetx、sry分别是基于我上面三个思路的方法,Y/Xreads比例(xy), X染色体杂合比(hetx), SRY基因 (sr