专栏十一:基因集和siganture的jaccard相似系数计算

本文介绍了如何使用Jaccard相似系数来衡量基因集之间的相似性,通过从GSEA数据库下载基因集合,挑选样本进行计算,并通过实战演练展示其在归类和分析HPV相关或opharyngeal carcinoma研究中的作用。
摘要由CSDN通过智能技术生成

这里不介绍Jaccard相似系数的定义了,最简单的例子

如集合A={1,2,3,4};B={3,4,5,6};
那么他们的J(X,Y)=1{3,4}/1{1,2,3,4,5,6}=1/3

那么如果你富集了几百个基因集,然后你想对这几百个基因集进行归类,肯定是根据基因集的相似性归类吧。比如都是3个基因集合,A通路是VIM IDO1 ITGB1 B是CD3 CD4 CD8 C是VIM ITHB1。那么肯定是A和C最像的,不过要怎么证明呢?

1.从GSEA base下载基因集合

library(GSVA)
library(GSVAdata)
library(GSEABase)
library(limma)


kegg <- getGmt("/home/data/ybk/genelist/c2.cp.kegg.v2023.1.Hs.symbols.gmt")  ##186 gene sets
reactome <- getGmt("/home/data/ybk/genelist/c2.cp.reactome.v2023.1.Hs.symbols.gmt")  ##1569 gene sets 

2.挑两个基因集合出来

var="KEGG_VIRAL_MYOCARDITIS"
var2="REACTOME_MAPK_FAMI
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

18kkk

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值