coloc.abf analysis

1#GWAS与eQTL共定位分析

基本思想:

第一种设想 H0: 表型1(GWAS)和 表型2 (以eQTL为例)与某个基因组区域的所有SNP位点无显著相关;
第二种设想 H1/H2: 表型1(GWAS)或表型2(以eQTL为例)与某个基因组区域的SNP位点显著相关;
第三种设想 H3: 表型1(GWAS)和 表型2 (以eQTL为例)与某个基因组区域的SNP位点显著相关,但由不同的因果变异位点驱动;
第四种设想 H4: 表型1(GWAS)和 表型2 (以eQTL为例)与某个基因组区域的SNP位点显著相关,且由同一个因果变异位点驱动;

2#coloc包分析的区域不能是整个基因组或者一整条染色体,必须是一个区域。并且要包含该区域的所有位点,不能用MAF或其他方式进行筛选;

如何确定选择区域。这里我们借用冻羊的小屋教程内容,可以参考的选择区域如下:

3#leadSNP是指与表型关联最强的SNP,通常是指可能和表型相关的关键位点。冻羊的教程中是采用p值最小的SNP作为leadSNP。我这里采用的SMR分析结果中的topSNP。

4#这里利用SMR里面所描述的方法,寻找目标基因topSNP 1000kb范围内的SNP。Linux中的命令行#双变量var1和var2,通过一个数组的方式,一一对应变化,适应于批量获取多个topSNP目标区域的所有snp。

var1=(rs2233823
rs1966494
rs35675666)
var2=(ENSG00000112667
ENSG00000113369
ENSG00000116288)
length=${#var1[@]}
for ((i=0; i<$length; i++))
do
./smr_v1.3.1_linux_x86_64_static --bfile g1000_eur --beqtl-summary ./cis-eQTL/cis-eQTLs-full_eQTLGen_AF_incl_nr_formatted_20191212.new.txt_besd-dense --query 1 --snp ${var1[$i]} --snp-wind 1000 --gene ${var2[$i]}  --out ./cancer/eqtl-coloc/${var1[$i]}_${var2[$i]}
done
;

5#topSNP的qtl数据已获取,之后与GWAS数据合并,在R中进行,for循环merge一下。

library(dplyr)
library(data.table)
breast_cancer = fread('./../../GWAS summary data/Breast cancer/Luminal_B.txt',header = T,sep = '\t')
breast_cancer = breast_cancer[,-8]
filest = list('rs12506352_ENSG00000038219.txt',
              'rs17118313_ENSG00000139613.txt'
)
filest=as.character(filest)
filelent <- length(filest)
newdatat <- c()
for(i in 1:length(filest)){
  temp <-read.table(filest[i],header = T,sep = "\t")
  newdatat = merge(temp,breast_cancer,by='SNP',all=T)
  newdatat = na.omit(newdatat)
  write.table(x= newdatat,file = filest[i],quote = F,sep = '\t',row.names = F)
}

6#共定位分析

library(coloc)
library(tidyr)
filest <- list.files(pattern = "*.txt")
filelent <- length(filest)
files <- gsub("\\.txt", "", filest)  
for(i in 1:length(filest)){
data = fread(filest[i],header = T,sep = '\t')
data = data %>% distinct(SNP,.keep_all = TRUE)
data = select(data,c('SNP','Freq','b','SE','beta','se'))
colnames(data) = c('snp','MAF','beta_eqtl','se_eqtl','beta_gwas','se_gwas')
data = mutate(data,N=1387)
data =mutate(data,varbeta_eqtl = se_eqtl*se_eqtl)
data = mutate(data,varbeta_gwas = se_gwas*se_gwas)
data1 = data[,c('beta_eqtl','varbeta_eqtl','snp','MAF','N')]
data2 = data[,c('beta_gwas','varbeta_gwas','snp')]
colnames(data2)=c("beta","varbeta","snp")
colnames(data1)=c("beta","varbeta","snp","MAF","N")
data1 = as.list(data1)
data2 = as.list(data2)
data2$type = "cc"
data1$type = "quant"
res = coloc.abf(data1,data2)
res_results = res$results
res_summary = res$summary
write.table(res_results,file = files[i],row.names = F,sep = '\t',quote = F)
write.table(res_summary,file = filest[i],row.names = F,sep = '\t',quote = F)
}

Coloc2是一个在ImageJ中使用的图像分析插件。该插件的主要功能是用于研究和分析图像中的共定位(或共定位)现象。 共定位是指两个或多个荧光染料或标签在细胞或组织中的分布位置存在重叠现象。Coloc2插件可以通过计算图像中颜色通道之间的相关性来量化和定量化共定位现象。该插件提供了多种计算共定位的方法,包括Pearson相关系数、Manders系数、Overlapping coefficient等等。通过这些计算指标,可以快速准确地评估荧光染料在图像中的共定位程度。 Coloc2插件具有简单易用的界面,用户只需导入图像,选择感兴趣的区域进行分析,即可得到共定位分析的结果。结果以图表和数值的形式呈现,用户可以方便地观察和比较不同组的共定位程度。此外,Coloc2插件还提供了图像的颜色通道合并功能,使用户可以直观地观察图像中不同染料的重叠情况。 Coloc2插件在细胞和分子生物学领域的研究中具有广泛的应用。它可以帮助科研人员定量分析细胞或组织中不同分子的相互作用关系,从而揭示细胞的分子机制和信号传导途径。此外,Coloc2插件还可以用于药物研发和药效评估等领域,帮助研究人员确定药物与靶点的共定位情况,从而提高药物疗效和副作用的评估准确性。 总之,Coloc2是一个功能强大且易于使用的ImageJ插件,可以方便地进行图像共定位分析,为细胞和分子生物学研究提供了有力的工具。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值