Biobank genetic data探析（二）

最新推荐文章于 2024-03-01 13:38:54 发布

想摸鱼的生信小白

最新推荐文章于 2024-03-01 13:38:54 发布

阅读量1.4k

点赞数 3

分类专栏： GWAS自学历程文章标签：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45899165/article/details/126345315

版权

本文详细介绍了基因库遗传数据补全技术Imputation，包括其概念、应用，特别是UK Biobank中使用的预相位方法。通过参考1000 Genomes和Haplotype Reference Consortium数据集，Imputation能够极大地增加可分析的SNP数量。此外，文章还描述了BGENv1.2文件格式和相关读取工具。

摘要由CSDN通过智能技术生成

Biobank genetic data探析（二）——Imputaion

1. 什么是imputation？

Imputation即为“补全”，初次接触到这个概念是利用scRNA-seq数据补全空间转录组数据，即利用计算方法解决空转检测到的mRNA类别少的问题。而在GWAS当中，则是利用reference数据集，补全那些芯片中没有检测到的variants。如UKBB所述，Affymatrix Axiom芯片只能测约80万个SNPs，而经imputation后我们实际能获得~96 million SNPs信息。

而作为reference的数据集，一个是 1000 Genomes phase 3 dataset，主要用以解决非欧洲祖籍人群的imputation；一个则是Haplotype Reference Consortium，为UKBB imputation主要的参考数据集。

再进一步深入之前，我们需要弄清楚genotype（基因型）与haplotype（单体型）的区别：基因型即为染色体单个位点的不同导致的形状变化，我们可以理解为一个genotype call就是一个SNP（此处包含INDEL）；而单体型则是一组SNPs，它们通常在同一个染色体上的不同位点，具有强的连锁不平衡性，是从父母亲直接继承下来的一套遗传信息，彼此之间有你就有我。

而著名的HapMap计划就是去发现人类基因组中这些成套的SNPs（即单体型），而每个单体型也有一些marker SNPs

最低0.47元/天解锁文章

想摸鱼的生信小白

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
4
评论
Biobank genetic data探析（二）

UKbiobank genetic data : imputation
复制链接

扫一扫

专栏目录

想摸鱼的生信小白 CSDN认证博客专家 CSDN认证企业博客

码龄5年

14: 原创

104万+: 周排名

38万+: 总排名

2万+: 访问

: 等级

176: 积分

50: 粉丝

22: 获赞

18: 评论

52: 收藏

私信

关注

热门文章

分类专栏

最新评论

Biobank genetic data探析（一）
possibe123: 提前谢谢你！老板催得很急，他想在数据能够下载之前就做好准备，一点都不考虑我们这些科研民工到底能不能从官方中找到这些信息
Biobank genetic data探析（一）
possibe123: 比如core dataset中的socio-demographics、lifestyle、family history、physical measures、early life and reproductive factors等等，就是basket那个界面中的core dateset各个大子类的数据下载大小还是不清楚。可否拜托你查询一下？我可以从你的这篇博文中了解到基因数据大概需要12TB（因为不知道老板到底要分析多少数据，所以我需要给他一个最大的需要购买的硬盘大小）
Biobank genetic data探析（一）
possibe123: 博主你好！打扰你了，因为我们课题组也申请了UKB tier3的数据，老板让我提前了解下各类数据的大小,方便我们后续下载存储数据。现在我在UKB 官方的 data access guide中可以找到bulk数据的大小，但是对于core data的大小还是不清楚。
Biobank genetic data探析（三）
yolo_krystal: 你好，请问下载中断的问题你后来解决了吗
Biobank genetic data探析（三）
zgxr: 可以请教一下博主怎么下载基因数据吗，我下载老是中断

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

想摸鱼的生信小白 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。