单细胞分析(23)——人类基因组版本详解

人类基因组版本详解(hg19 vs hg38)

在这里插入图片描述

1️⃣ 人类基因组主要版本

人类基因组是一个庞大的 DNA 序列数据库,科学家们使用 参考基因组(Reference Genome) 进行基因组测序、比对和功能分析。随着技术的进步,参考基因组不断更新。

🔍 人类基因组主要版本对比

基因组版本别名发布年份主要特点
GRCh36NCBI362006早期基因组版本,不再使用
GRCh37hg192010长期使用的标准,仍被部分数据库支持
GRCh38hg382013目前的主流版本,修正了基因坐标错误,增加假染色体(ALT)
T2T-CHM132022首个完整人类基因组,填补了 GRCh38 缺失的 8% DNA

💡 为什么参考基因组会更新?

  1. 修正错误:早期版本中的基因坐标和拼接可能有误。
  2. 补充缺失区域:GRCh37 和 GRCh38 仍然缺失一些着丝粒和端粒区域。
  3. 改进基因注释:更新基因模型,提高基因识别准确度。
  4. 提升比对精准度:假染色体(ALT)能更好地解析重复区域。

2️⃣ 什么是 hg19 和 hg38?

  • hg 代表 Human Genome(人类基因组)
  • 1938 分别对应 第 19 版(GRCh37)和第 38 版(GRCh38)
  • hg19hg38UCSC 基因组数据库的命名方式
  • hg19 = GRCh37hg38 = GRCh38,只是命名方式不同。

2️⃣ GRCh 全称是什么?

GRCh = Genome Reference Consortium Human人类基因组参考联盟

完整版本名称:

  • GRCh37(2010 年发布,对应 hg19
  • GRCh38(2013 年发布,对应 hg38

🔍 主要参与机构

  • NCBI(美国国家生物技术信息中心)
  • EBI(欧洲生物信息学研究所)
  • UCSC(加州大学圣克鲁兹分校)
  • WTSI(英国桑格研究所)

🚀 GRC 负责修正、更新和改进基因组版本,确保科学研究和临床应用使用最新的参考基因组!


3️⃣ hg19 vs hg38 的主要区别

特点hg19(GRCh37)hg38(GRCh38)
发布日期20102013
基因坐标旧版,部分坐标有误修正了部分坐标,基因定位更准确
染色体编号格式chr1, chr2, chrX1, 2, X(Ensembl 格式)
假染色体(ALT)❌ 无新增 261 个 ALT 序列,改进基因组比对
去除错误拼接的区域❌ 部分错误仍然存在✅ 修正基因拼接错误
是否推荐使用已逐步淘汰目前的标准版本

4️⃣ 如何确认我的数据是 hg19 还是 hg38?

✅ 方法 :查看基因 ID 格式

head(gene_names)
基因名格式可能的基因组版本
ENSG00000141510Ensembl ID(可能是 hg38)
TP53, ZNF143HGNC Symbol(可能是 hg19 或 hg38)
chr17:7579472-7590856基因坐标(可能是 hg19)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

生信小鹏

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值