这些列名表示的是基因组关联研究(GWAS)或类似分析中的数据结果,通常用于描述基因位点(如SNP)的统计学特征、效应估计和种群相关性等信息。以下是每列的解释:
-
chr:染色体编号,指示该基因位点位于哪个染色体上(如1到22,X或Y)。
-
pos:基因组位置,表示位点在染色体上的具体位置(以碱基对为单位)。
-
ref:参考等位基因(reference allele),基因组参考序列中的碱基。
-
alt:变异等位基因(alternative allele),指示该位点上的变异形式。
-
af_meta_hq:高质量meta分析中变异等位基因的频率(allele frequency)。
-
beta_meta_hq:高质量meta分析中变异等位基因效应的回归系数(beta coefficient)。表示变异与表型之间的关联强度和方向。
-
se_meta_hq:高质量meta分析中效应估计的标准误差(standard error)。
-
neglog10_pval_meta_hq:高质量meta分析中效应的负对数10的p值,用于评估关联的显著性(越高表示越显著)。
-
neglog10_pval_heterogeneity_hq:高质量meta分析中的异质性p值的负对数10,用于评估不同研究间结果的一致性。
-
af_meta:总体meta分析中变异等位基因的频率。
-
beta_meta:总体meta分析中的变异效应回归系数。
-
se_meta:总体meta分析中效应估计的标准误差。
-
neglog10_pval_meta:总体meta分析中效应的负对数10的p值。
-
neglog10_pval_heterogeneity:总体meta分析中的异质性p值的负对数10。
15-19. af_AFR、af_AMR、af_CSA、af_EAS、af_EUR、af_MID:
在不同人群中的变异等位基因频率:
- AFR:非洲人群
- AMR:美洲人群
- CSA:南亚人群
- EAS:东亚人群
- EUR:欧洲人群
- MID:中东人群
20-25. beta_AFR、beta_AMR、beta_CSA、beta_EAS、beta_EUR、beta_MID:
不同人群中变异效应的回归系数。
26-31. se_AFR、se_AMR、se_CSA、se_EAS、se_EUR、se_MID:
不同人群中效应估计的标准误差。
32-37. neglog10_pval_AFR、neglog10_pval_AMR、neglog10_pval_CSA、neglog10_pval_EAS、neglog10_pval_EUR、neglog10_pval_MID:
不同人群中效应的负对数10的p值。
38-43. low_confidence_AFR、low_confidence_AMR、low_confidence_CSA、low_confidence_EAS、low_confidence_EUR、low_confidence_MID:
在不同人群中是否存在低置信度的标志位,通常是二进制值(0/1)。1表示结果的置信度较低。
总结:
这些列主要用于描述每个变异位点的基因组信息(如位置和参考/变异碱基)、不同人群中的频率和效应,以及统计学分析结果(如效应大小、标准误和显著性水平)。