上一篇文章因为数据量比较大,所以我在此打算单独开篇展示统计的与 Illumina HumanHap 有关的芯片原始文件转化。国外的5家常见测序公司里只有 23andMe 的V1和V2使用的位点集和 HumanHap 550 有关的(其中V1版本未找到)。数据见如下的图中:
1.国内格式转国外与 HumanHap 相关格式的转化率图(按基因位点位置转化)
2.国内格式转国外与 HumanHap 相关格式的未检出位点数图
3.上述格式跑一些祖源计算器的理想利用率图(这里的原始数据文件第4列都填满了纯合位点,其中“[#ANY]”代表这个系列下的任意一个计算器)
注:图中的 HGDP Map 是斯坦福大学的 HGDP 的 NCBI36(hg18)坐标样本格式,样本人数为1043,且此格式与 Illumina HumanHap 650 格式高度相关。另外,1240K 的科研样本格式正向转化为 Illumina HumanHap 当中小于100万个位点格式的转化率也极高,运行祖源计算器的最大位点利用率也很高,建议将文中第3张图和类 Omni 格式的图对照观看。