GWAS: 网页版的基因型填充（genotype imputation）

最新推荐文章于 2024-03-16 09:39:52 发布

weixin_33966365

最新推荐文章于 2024-03-16 09:39:52 发布

阅读量1.4k

点赞数 1

原文链接：http://www.cnblogs.com/chenwenyan/p/10830207.html

版权

在全基因组关联分析中，处理芯片数据时，必须走的一个流程就是基因型数据填充（imputation）。

当然，如果你拿到的是全测序的数据，请忽略这一步。

下面直奔主题，怎么在网页版进行基因型填充。

1 进入Michigan Imputation Server

Michigan Imputation Server网站链接：https://imputationserver.sph.umich.edu/index.html#!pages/home

进入该网站，进行注册。

注册完以后，接下来准备imputation需要的输入文件

2 准备imputation需要的输入文件

Michigan Imputation Server网站只接受压缩包的vcf格式（vcf.gz），故需要先将手头上的文件转化为vcf.gz格式

2.1 转化ped/map为vcf格式文件

plink --ped mystudy_chr1.ped --map mystudy_chr1.map --recode vcf --out mystudy_chr1

2.2 将vcf格式文件压缩为vcf.gz格式

这一步骤需要安装VCFtools和tabix两个工具

安装成功后，使用如下命令：

vcf-sort mystudy_chr1.vcf | bgzip -c > mystudy_chr1.vcf.gz

3 上传数据

以下两种方式任选一种。

3.1 上传vcf.gz文件的方式

具体使用操作见下图：

3.2 上传链接的方式

4 坐等邮件, 收结果

转载于:https://www.cnblogs.com/chenwenyan/p/10830207.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_33966365

关注关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

GWAS ATLAS:最全面的GWAS数据库

庐州月光的博客

11-24

6547

欢迎关注”生信修炼手册”!GWAS ATLAS数据库收录了来自4756个人类不同表型的GWAS结果，并进行了不同表型间的遗传相关性分析，对应的文献发表在nature genetics上，...

GWAS大家都知道，Gene-Based GWAS你了解吗？

庐州月光的博客

10-27

1788

欢迎关注”生信修炼手册”!GWAS称之为全基因组关联分析，传统意义上的GWAS针对单个SNP位点进行分析，来寻找与疾病或者性状相关联的SNP位点。在过去的几十年，依托高通量基因分型技术的...

参与评论您还未登录，请先登录后发表或查看评论

SNIPar：父母基因型的孟德尔插补，基于家庭的GWAS和多基因评分分析

03-04

斯尼帕尔 SNIPar（父母的单核苷酸插补）是一个python库，用于从核心家庭中观察到的基因型中估算缺失的父母基因型，并进行基于家庭的全基因组关联和多基因评分分析。主要特点：给定一个核心家庭中观察到的基因型，估算缺失的父母基因型（impute_runner.py）。使用观察到的和估算的父母基因型（fGWAS.py）执行基于家庭的GWAS。使用观察/估算的父母基因型从SNP权重计算先证者，兄弟姐妹和父母的多基因得分，并进行基于家庭的多基因得分分析（fPGS.py脚本）。文献资料建议完成以下教程： : 并阅读指南： : 有关模块和脚本的文档，请访问： : 软件包安装说明 SNIPar具有以下依赖项：的Python 3.7 包装方式： h5py bgen阅读器麻木科学的 pysnp工具大熊猫网络赛顿我们强烈建议您使用Python发行版，例

基因型填补

hgz2020的博客

03-12

1148

基因分型

GAIN-GTEx：带有生成对抗性插补网络的基因表达插补

02-13

带有生成对抗性插补网络（GAIN-GTEx）的基因表达插补该存储库包含论文《的代码作者： RamonViñas，Tiago Azevedo，Eric R. Gamazon和PietroLiò 抽象的基本生物学意义的问题是，基因子集的表达可在多大程度上恢复完整的转录组，这对生物学发现和临床应用具有重要意义。为了解决这一挑战，我们提出了基于增益对抗插补网络的基因表达插补方法GAIN-GTEx。为了提高我们方法的适用性，我们利用了GTEx v8的数据，GTEx v8是一种参考资源，已从多种人体组织中生成了完整的转录组。我们将模型与几种标准和最新的插补方法进行了比较，结果表明，GAIN-GTEx在预测性能和运行时间方面均明显优越。此外，我们的结果表明，在不同缺失水平上，来自3种癌症类型的RNA-Seq数据具有很强的概括性。我们的工作可以促进将大规模RNA生物存储库经济有效地整合到

GWAS相关名词解释及基础知识储备[长期更新]

热门推荐

Cccrush的博客

09-18

1万+

转载自http://www.360doc.com/content/18/1115/16/42030643_795076897.shtml 相关名词解释 Genome-wide association studies（关联分析）：扫描遗传标记，通常是单核苷酸多态性（SNPs），使用统计学相关的手段以发现与性状相关的变异体 Complex traits（杂合性状）：无论是由多基因和环境因素共同作...

GWAS_tutorial 学习笔记

weixin_44203980的博客

06-22

1103

主要是根据https://github.com/MareesAT/GWA_tutorial跑了一遍GWAS的基本流程，以及附有一些个人理解

GWAMA:GWAS meta-analysis的又一利器

庐州月光的博客

10-24

1761

欢迎关注”生信修炼手册”!meta-analysis对多个独立研究的成果进行综合评估，该技术在医学，心理学等领域早已广泛使用。虽然该技术的理论基础早已成熟，但是在GWAS分析领域，还是有...

gwas snp 和_GWAS综述（生信文献阅读俱乐部精选）

weixin_42513512的博客

12-23

1998

生信文献阅读俱乐部的首年活动进入尾期，部分俱乐部成员从头到尾坚持下来了，优秀程度不下于我！这里展示澳大利亚胡同学的第20周的GWAS综述翻译稿件：From genome- wide associations to candidate causal variants by statistical fine- mapping摘要从具有遗传标记的复杂性状的统计学关联推进到理解影响性状的功能性遗传变异往往...

GWAS中的Gene-Gene Interactions如何分析？看这里

庐州月光的博客

10-30

700

欢迎关注”生信修炼手册”!在遗传学中，当两个基因相互作用然后导致对应性状的出现，说明两个基因间存在相互作用。在之前的文章中，介绍了很多的基因相互作用模型，列表如下互补作用积加作用重复作用...

Gene-function-imputation:通过共表达进行基因功能归因

05-05

基因功能输入通过共表达进行基因功能归因

imputationserver:密歇根插补服务器

05-16

该存储库包含基于Minimac4的工作流程的完整源代码。工作流程本身由用于Hadoop MapReduce的执行。密歇根插补服务器包括几个并行化的流水线步骤：质量控制质检报告阶段和归因压缩与加密文献资料该文档位于。引文如果您使用密歇根插补服务器，请引用本文： Das S，Forer L，SchönherrS，Sidore C，Locke AE，Kwong A，Vrieze S，Chew EY，Levy S，McGue M，Schlessinger D，Stambolian D，Loh PR，Iacono WG，Swaroop A，Scott LJ，Cucca F ，Kronenberg F，Boehnke M，Abecasis GR，FuchsbergerC。。自然遗传学48，1284–1287（2016）。接触如有任何问题，请随时与联系。贡献者卢卡斯

PLINK NG：下一代基因组关联分析工具

最新发布

gitblog_00056的博客

03-16

424

PLINK NG：下一代基因组关联分析工具 PLINK NG 是一个用于执行基因组关联分析（GWAS）的命令行程序。该程序由 Charles Chang 开发，并且是在原版 PLINK 的基础上进行了优化和扩展的版本。什么是 PLINK NG？ PLINK NG 是一个开源的生物信息学工具，它可以帮助研究人员对大规模遗传数据集进行分析。它的主要功能包括：格式转换：将不同的遗传数据格式转换为 ...

Michigan Imputation Server:基因型填充的在线工具

庐州月光的博客

09-21

1305

欢迎关注”生信修炼手册”!得益于分析软件运行速度的不断提高，硬件资源消耗的不断优化，基因型填充这一计算量巨大的任务也出现了web服务，Michigan Imputation Server...

使用Minimac进行基因型填充

庐州月光的博客

09-16

1909

欢迎关注”生信修炼手册”!Minimac是一款经典的基因型填充软件，该软件也是以内存消耗小，运行速度快而著称，历经了MaCH, minimac, minimac2, minmac3多个版...

用重测序数据对芯片测序数据进行基因组填充

m0_54898708的博客

10-09

1074

file1是从网上下载的山羊的重测序文件，SBWC_goat 是山羊的芯片测序数据文件（两个都是软链接到别人目录下的）计划用file1对SBWC_goat*做基因型填充beagle命令; 1.输入文件gt处理 1.1plink正常格式转二进制格式 map和bed文件转vcf要先转二进制文件、再转vcf（-_-||）转二进制文件命令 --make-bed由于楼主这里染色体数目不是人类的23是羊的故设置--chr-set 30并且还包括一些个体编号故加上--allow-extra-chr 输入命令

用R和BioConductor进行基因芯片数据分析(二)：缺失值填充

weixin_34352005的博客

12-05

560

以下分析用到的数据可以在这里(http://dl.getdropbox.com/u/308058/blog/raw_data_3_replicates.txt )下载，这个数据来自关于基因对蝴蝶迁移性的研究，样本是20个蝴蝶个体，其中10个是当地固有个体(old)，另外10个是新迁入的个体(new)，old和new个体两两随机配对，分别用不同颜色染料（波长分别为555和647nm）标记后，在同一张...

GWAS中的genotype imputation简介

庐州月光的博客

09-08

3188

欢迎关注”生信修炼手册”!GWAS用于寻找与疾病或者特定性状相关联的SNP位点，为了更加有效的挖掘信息，GWAS需要大样本量和高密度的SNP分型结果，最佳的分型方案当然是全基因组测序，然...

【文献阅读笔记】（2）：使用IMPUTES2和minimac软件完成群体特异性的基因型填充(Imputation)

Yujia's Blog

04-20

5197

Population-specific genotype imputations using minimac or IMPUTE2摘要1. 介绍-Introduction1.1 基本知识1.2 GoNL参考数据集简介1.3 进行基因型填充(Imputaion)的工具1.4 对待填充的目标数据集进行质量控制摘要文章来源于Nature Protocol 本篇文章提供了一份guideline来...

plink基因型填充

09-14

基因型填充是指根据已有的基因型数据来推断缺失位点的基因型。Plink是常用的进行基因型填充的软件之一。在基因型填充过程中，Plink使用了多种算法和方法来准确估计缺失位点的基因型。 Plink的基因型填充功能可以通过使用不同的命令行选项来实现。其中最常用的是"--fill-missing-genotypes"选项，该选项允许使用不同的方法进行基因型填充。这些方法包括最大似然估计、EM算法和贝叶斯方法等。用户可以根据自己的需求选择合适的填充方法。在进行基因型填充之前，需要注意样本的数据质量以及所使用的参考数据的质量。样本数据的质量可以通过分析分型结果的准确率来评估，而参考数据的质量可以通过参考面板的选择来控制。此外，样本量的大小和SNP的密度也会对基因型填充的准确性产生影响。为了保证基因型填充的准确性，还需要考虑样本的杂合度和哈温平衡。在进行基因型填充之前，需要确保样本符合哈温平衡的假设。如果样本中存在纯合基因型或杂合度较低的样本，可能会导致填充结果的不准确性。在GWAS分析中，通常需要移除这些样本以保证群体符合哈温平衡的假设。总结起来，基因型填充是使用已有的基因型数据来推断缺失位点的基因型。Plink是常用的进行基因型填充的软件之一，它提供了多种方法和算法来实现基因型填充。在进行基因型填充之前，需要注意样本数据的质量、参考数据的质量以及样本的杂合度和哈温平衡。