GSEA | 基因富集分析

最新推荐文章于 2024-05-29 11:59:29 发布

可爱的一只帆

最新推荐文章于 2024-05-29 11:59:29 发布

阅读量1.4k

点赞数

文章标签：学习方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43022495/article/details/130265626

版权

软件下载网址：GSEA (gsea-msigdb.org)

GSEA不需要设置阈值过滤基因，有助于我们从整体通路分析差异。

一.数据准备

1.数据集（tpm_bulk.gct）：你需要分析的表达矩阵，建议bulk数据用tpm标准化后的

第一行：#1.2默认的，不用改

第二行：矩阵总共的基因数量和样本数量

第三行及下：你的表达矩阵，Description不能为空，可以是na

可以在excel里处理文件，保存为制表符分隔文件（.txt），直接重命名改后缀为gct即可。

2.样本信息表（DATA_info.cls）

第一行：样品总数、分组数、不用改的数字1

第二行：样品分组名称

第三行：样品分组信息，与.gct文件对应

3.参考基因集（geneset.gmt）

第一列：通路名称

第二列：通路编号

第三列及之后：该通路包含的所有基因，基因名称需要与.gct文件中的基因名称一致

常用的有KEGG和GO基因集，获取基因集的方法：

1）MSigDB官网以及GSEA软件自带的基因集，大部分是有的，但是比KEGG官网上少了很多，官网也有一直在更新，MSigDB官网和GSEA软件没有跟上

2）自己去官网下载制作，生信技能树之前有提到过

3）最近看到python爬取KEGG数据库的，使用更方便，研究中……

二.软件使用

1.上传数据（load data）

直接上传前面准备的三个文件即可，成功了会提示No Error。

2.参数设置

Expression dataset：选择上传的表达矩阵.gct

Gene sets database：选择上传或自带的基因集.gmt

Number of permutations：置换检验的次数，一般为1000

Phenotype labels：需要比较的两组，.cls文件的分组，实验组比对照组

Collapse/Remap to gene symbols：基因symbol转换，文件的基因都是symbol就选No

Permutation type：每组样本数量大于7选phenotype，否则选gene_set

Analysis name：输出的文件名

Plot graphs for the top sets of each phenotype：最终画图的数量

3.运行：直接Run

4.查看结果

运行完左侧这里会出现文件名和succes，双击可以打开网页查看结果，一般通过|NES|>1&p-value<5%&FDR q-val<25%筛选结果，如果数量太多可以更严格一些筛选，或者考虑是不是输入的文件有问题。

可爱的一只帆

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
GSEA | 基因富集分析

GSEA富集分析
复制链接

扫一扫

可爱的一只帆 CSDN认证博客专家 CSDN认证企业博客

码龄6年

38: 原创

73万+: 周排名

4万+: 总排名

3万+: 访问

: 等级

524: 积分

141: 粉丝

136: 获赞

18: 评论

201: 收藏

私信

关注

热门文章

分类专栏

最新评论

单细胞｜GeneTrajectory·基因轨迹
Ian12: 用 reticulate R 包设置 virtualenv，py_install安装gene-trajectory。这一步出现问题：> if(!reticulate::virtualenv_exists('gene_trajectory')){ + reticulate::virtualenv_create('gene_trajectory', packages=c('gene_trajectory')) + } Error in stop_no_virtualenv_starter(version = version, python = python) : Suitable Python installation for creating a venv not found. Requested Python: /usr/bin/python3.10 Please install Python with one of following methods: - https://github.com/rstudio/python-builds/ - reticulate::install_python(version = '<version>') - sudo apt install python3-venv
Milo | 细胞分布差异
weixin_51178697: 但是不同细胞在Umap空间上的位置也没有什么特定的意义啊. 感觉好像直接根据条件赋颜色画图也能看
Slingshot|单细胞轨迹推断r包
可爱的一只帆: 文章的材料与方法部分有下载地址
Slingshot|单细胞轨迹推断r包
qq_48256313: 您好，请问可否请教如何下载该数据集？
单细胞 | pySCENIC·转录因子分析（二）
CSDN-Ada助手: “恭喜您写了第20篇博客！看来您对转录因子分析有着深入的研究和理解，非常令人钦佩。希望您可以继续分享更多关于pySCENIC的使用经验，或者可以结合其他工具进行更深入的探索和比较分析，这样可以让读者更全面地了解相关领域的知识。期待您的下一篇作品！”

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。