GWAS数据下载详解(2)

1、FinnGen数据库:Risteys FinnGen R11 + FinRegistryhttps://risteys.finregistry.fi/

以检索"glaucoma"(青光眼)为例:https://risteys.finregistry.fi/

 

 

 下载数据:

 链接:https://storage.googleapis.com/finngen-public-data-r9/summary_stats/finngen_R11_H7_GLAUCOMA.gz

 特点:R11代表数据库,H7_GLAUCOMA是endpoint name,其他数据可以替换后下载。

使用R语言整理数据:

字段含义:Data description - FinnGen DocumentationFile naming pattern and file structurehttps://finngen.gitbook.io/documentation/data-description#summary-association-statistics

"#chrom" :染色体;"pos"位置;"ref"对照等位基因;"alt":效应等位基因;"rsids":变量标识符;"nearest_genes":最近基因; "pval" p值;"mlogp" -log10P;"beta":效应大小;sebeta效应大小标准差;"af_alt":效应等位基因频率;"af_alt_cases":病例中的效应等位基因频率;"af_alt_controls":对照组中效应等位基因频率。

用TwoSampleMR整理出暴露数据和结局数据。

#读取下载内容
setwd("D:\\")#查看R语言当前工作路径,将txt文件放置给文件夹
library('data.table')
a <- fread("finngen_R9_O15_PRE_OR_ECLAMPSIA.gz",header = T)
save(a,file="Finngen.RData")
#获取数据变量
colnames(a)
#筛选强相关的变量:若5E-8筛选出来的变量较少,可适当调大P值(须有文献根据)
ab<-subset(a,pval<5e-8)
ab$phenotype<-"PRE_OR_ECLAMPSIA"
#load("整理.RData")
save(ab,file="整理.RData")
#整理为TwoSampleMR所需要的双样本数据
library(TwoSampleMR)
#暴露数据
exposure<-format_data(ab,
                      type = "exposure",
                      snp_col = "rsids",
                      phenotype_col = "phenotype",
                      beta_col = "beta",
                      se_col = "sebeta",
                      eaf_col="af_alt",
                      effect_allele_col = "alt",
                      other_allele_col = "ref",
                      pval_col = "pval")
#去除连锁不平衡(linkage disequilibrium)
exposure_data<-clump_data(exposure,clump_r2 = 0.001)

#结局数据
outcome<-format_data(ab,
                     snps=exposure_data$SNP,
                     type = "outcome",
                     snp_col = "rsids",
                     phenotype_col = "phenotype",
                     beta_col = "beta",
                     se_col = "sebeta",
                     eaf_col="af_alt",
                     effect_allele_col = "alt",
                     other_allele_col = "ref",
                     pval_col = "pval")

整理出数据后即可进行分析。

 

  • 21
    点赞
  • 88
    收藏
    觉得还不错? 一键收藏
  • 12
    评论
在R语言中,您可以使用各种包和工具来整理和处理GWAS数据。以下是一个基本的整理GWAS数据的步骤示例: 1. 导入所需的R包:首先,您需要导入一些用于处理数据的R包,例如`dplyr`和`tidyr`。 ```R library(dplyr) library(tidyr) ``` 2. 读取GWAS数据:使用适当的函数(例如`read.table()`或`read.csv()`)读取GWAS数据文件,并将其存储为一个数据框。 ```R gwas_data <- read.table("path/to/gwas_data.txt", header = TRUE, sep = "\t") ``` 请注意,上述代码中的文件路径应替换为实际的GWAS数据文件路径,并根据数据文件的格式进行修改。 3. 数据清洗和整理:根据您的需求,您可能需要进行一些数据清洗和整理操作。例如,删除不需要的列、处理缺失值、转换数据类型等。 ```R # 删除不需要的列 gwas_data <- gwas_data %>% select(SNP, p_value, effect_size) # 处理缺失值(示例:用平均值填充) gwas_data$effect_size[is.na(gwas_data$effect_size)] <- mean(gwas_data$effect_size, na.rm = TRUE) # 转换数据类型(示例:将p_value转换为对数) gwas_data$p_value <- -log10(gwas_data$p_value) ``` 根据您的具体需求,您可能需要进行更多的数据清洗和整理操作。 4. 数据分析和可视化:一旦数据整理完成,您可以使用各种分析和可视化技术来探索和呈现GWAS数据。例如,您可以计算和绘制Manhattan图、进行基因注释等。 ```R # 绘制Manhattan图 library(ggplot2) ggplot(gwas_data, aes(x = SNP, y = p_value)) + geom_point() + scale_x_discrete(labels = function(x) gsub("_", "\n", x)) + theme(axis.text.x = element_text(angle = 45, hjust = 1)) ``` 请注意,上述代码中的绘图示例仅供参考,您可能需要根据自己的数据和需求进行适当的修改。 这只是一个简单的示例,您可以根据自己的需求和具体的GWAS数据格式进行更复杂的数据整理和分析操作。如果您有特定的问题或需求,请提供更多细节,我将尽力帮助您。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值