基因组关联研究(GWAS)数据相关概念

这些列名表示的是基因组关联研究(GWAS)或类似分析中的数据结果,通常用于描述基因位点(如SNP)的统计学特征、效应估计和种群相关性等信息。以下是每列的解释:

  1. chr:染色体编号,指示该基因位点位于哪个染色体上(如1到22,X或Y)。

  2. pos:基因组位置,表示位点在染色体上的具体位置(以碱基对为单位)。

  3. ref:参考等位基因(reference allele),基因组参考序列中的碱基。

  4. alt:变异等位基因(alternative allele),指示该位点上的变异形式。

  5. af_meta_hq:高质量meta分析中变异等位基因的频率(allele frequency)。

  6. beta_meta_hq:高质量meta分析中变异等位基因效应的回归系数(beta coefficient)。表示变异与表型之间的关联强度和方向。

  7. se_meta_hq:高质量meta分析中效应估计的标准误差(standard error)。

  8. neglog10_pval_meta_hq:高质量meta分析中效应的负对数10的p值,用于评估关联的显著性(越高表示越显著)。

  9. neglog10_pval_heterogeneity_hq:高质量meta分析中的异质性p值的负对数10,用于评估不同研究间结果的一致性。

  10. af_meta:总体meta分析中变异等位基因的频率。

  11. beta_meta:总体meta分析中的变异效应回归系数。

  12. se_meta:总体meta分析中效应估计的标准误差。

  13. neglog10_pval_meta:总体meta分析中效应的负对数10的p值。

  14. neglog10_pval_heterogeneity:总体meta分析中的异质性p值的负对数10。

15-19. af_AFRaf_AMRaf_CSAaf_EASaf_EURaf_MID
在不同人群中的变异等位基因频率:

  • AFR:非洲人群
  • AMR:美洲人群
  • CSA:南亚人群
  • EAS:东亚人群
  • EUR:欧洲人群
  • MID:中东人群

20-25. beta_AFRbeta_AMRbeta_CSAbeta_EASbeta_EURbeta_MID
不同人群中变异效应的回归系数。

26-31. se_AFRse_AMRse_CSAse_EASse_EURse_MID
不同人群中效应估计的标准误差。

32-37. neglog10_pval_AFRneglog10_pval_AMRneglog10_pval_CSAneglog10_pval_EASneglog10_pval_EURneglog10_pval_MID
不同人群中效应的负对数10的p值。

38-43. low_confidence_AFRlow_confidence_AMRlow_confidence_CSAlow_confidence_EASlow_confidence_EURlow_confidence_MID
在不同人群中是否存在低置信度的标志位,通常是二进制值(0/1)。1表示结果的置信度较低。

总结:

这些列主要用于描述每个变异位点的基因组信息(如位置和参考/变异碱基)、不同人群中的频率和效应,以及统计学分析结果(如效应大小、标准误和显著性水平)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值