GWAS数据下载详解(3)

(1)GWAS Catalog

关于GWAS Catalog数据库的下载,本文主要使用gwasrappid实现。

#使用gwasrappid
library(gwasrapidd)
help(package="gwasrappid")
#获取研究
my_studies<-get_studies(study_id = 'GCST000858', variant_id = 'rs12752552')
#示例1:寻找与自身免疫相关的靶点
my_studies <- get_studies(efo_trait = 'autoimmune disease')
gwasrapidd::n(my_studies)#显示获得了多少项研究
my_studies@studies$study_id#获取研究ID
my_studies@publications$title#研究标题
open_in_pubmed(my_studies@publications$pubmed_id)#打开浏览器
my_associations <- get_associations(study_id = my_studies@studies$study_id)#
gwasrapidd::n(my_associations)#得到182个关联
dplyr::filter(my_associations@associations, pvalue < 1e-6) %>% # 根据P值筛选
  tidyr::drop_na(pvalue) %>%
  dplyr::pull(association_id) -> association_ids # 提取关联ID
my_associations2 <- my_associations[association_ids]
gwasrapidd::n(my_associations2)#180个
#展示变体、风险等位基因和风险频率
my_associations2@risk_alleles[c('variant_id', 'risk_allele', 'risk_frequency')]

(2)UK Biobank

http://www.nealelab.is/uk-biobank

 使用wget下载:如何在windows中安装wget,参考:wget 的安装与使用(Windows)_windows wget_Billie使劲学的博客-CSDN博客

 win+R后再输入框内输入cmd,打开命令端后,输入下载链接。这个xlsx表格可在本文的资源绑定处下载。

 在目录中即可查看到下载的文件。接下来需要整理数据。

library(data.table)
snp150_hg19=fread('snp150_hg19.txt',data.table=F)
save(snp150_hg19,file ='snp150_hg19.Rdata')
load('snp150_hg19.Rdata')
#读取下载的GWAS数据
GWAS_1=fread('100001_irnt.gwas.imputed_v3.female.tsv',data.table = F)
head(GWAS_1)
GWAS_1$`chromosome:start`=paste0(GWAS_1$chr,':',GWAS_1$pos)
GWAS_1 <- GWAS_1[,c(11,1:10)]
GWAS_1[1:10,]
data=dplyr::inner_join(GWAS_1,snp150_hg19,by='chromosome:start')
head(data)
save(data,file ='100001_irnt_gwas_imputed_v3_female.Rdata')

snp150_hg19.txt的下载链接:

链接:https://pan.baidu.com/s/1sAug3RugJy7eXAUHZhi7rA?pwd=1234
提取码:1234

  • 7
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
R语言中,您可以使用各种包和工具来整理和处理GWAS数据。以下是一个基本的整理GWAS数据的步骤示例: 1. 导入所需的R包:首先,您需要导入一些用于处理数据的R包,例如`dplyr`和`tidyr`。 ```R library(dplyr) library(tidyr) ``` 2. 读取GWAS数据:使用适当的函数(例如`read.table()`或`read.csv()`)读取GWAS数据文件,并将其存储为一个数据框。 ```R gwas_data <- read.table("path/to/gwas_data.txt", header = TRUE, sep = "\t") ``` 请注意,上述代码中的文件路径应替换为实际的GWAS数据文件路径,并根据数据文件的格式进行修改。 3. 数据清洗和整理:根据您的需求,您可能需要进行一些数据清洗和整理操作。例如,删除不需要的列、处理缺失值、转换数据类型等。 ```R # 删除不需要的列 gwas_data <- gwas_data %>% select(SNP, p_value, effect_size) # 处理缺失值(示例:用平均值填充) gwas_data$effect_size[is.na(gwas_data$effect_size)] <- mean(gwas_data$effect_size, na.rm = TRUE) # 转换数据类型(示例:将p_value转换为对数) gwas_data$p_value <- -log10(gwas_data$p_value) ``` 根据您的具体需求,您可能需要进行更多的数据清洗和整理操作。 4. 数据分析和可视化:一旦数据整理完成,您可以使用各种分析和可视化技术来探索和呈现GWAS数据。例如,您可以计算和绘制Manhattan图、进行基因注释等。 ```R # 绘制Manhattan图 library(ggplot2) ggplot(gwas_data, aes(x = SNP, y = p_value)) + geom_point() + scale_x_discrete(labels = function(x) gsub("_", "\n", x)) + theme(axis.text.x = element_text(angle = 45, hjust = 1)) ``` 请注意,上述代码中的绘图示例仅供参考,您可能需要根据自己的数据和需求进行适当的修改。 这只是一个简单的示例,您可以根据自己的需求和具体的GWAS数据格式进行更复杂的数据整理和分析操作。如果您有特定的问题或需求,请提供更多细节,我将尽力帮助您。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值