❝
这个章节,主要是人类性别的信息的质控,主要是根据性染色上SNP的比值,判断性别,然后把性别错误的个体去掉或者更改性别信息。对其它物种参考意义不大,因为在动物中一般把性别信息的SNP去掉,植物中一般都是雌雄同体的,不涉及到这个问题,之所以会有这一篇,是因为原文中有这个信息,而且plink 也有--check-sex的参数,所以操作一下,留下笔记。
❞
「原理:」检查性别差异。先验信息,女性的受试者的F值必须小于0.2,男性的受试者的F值必须大于0.8。这个F值是基于X染色体近交(纯合子)估计。不符合这些要求的受试者被PLINK标记为“PROBLEM”。
「上一步,去掉缺失信息后,现在有文件是过滤缺失后的文件:」
HapMap_3_r3_5.bed HapMap_3_r3_5.fam HapMap_3_r3_5.irem
HapMap_3_r3_5.bim HapMap_3_r3_5.hh HapMap_3_r3_5.log
1. 检查性别冲突
plink --bfile HapMap_3_r3_5 --check-sex
结果文件:plink.sexcheck第一列为家系ID,第二列为个体ID,第三列为系谱中的性别,第四列为SNP推断的性别,第五列是否正常,第六列为F值。
「使用R语言作图:」
gender
pdf("Gender_check.pdf")
hist(gender[,6],main="Gender