数据格式_GSEA数据分析需要的数据格式文件

本文详细介绍了GSEA数据分析需要的各种数据格式,包括表达式数据(gct, res, pcl, txt)、表型数据(cls)、基因集数据库(gmx, gmt, grp, xml)、微阵列芯片注释(.chip)和基因排名列表(.rnk)的格式要求和用途。" 38900055,1381349,Oracle EBS发运模块详解与操作实践,"['Oracle EBS', '供应链管理', '库存管理', '物流发运', '企业资源计划']
摘要由CSDN通过智能技术生成

信息来源:

Data formats - GeneSetEnrichmentAnalysisWiki

本文以GSEA分析所需要的文件格式为例进行讲解

1.表达式数据格式(.gct、.res、.pcl、.txt);

2.表型数据格式(.cls);

3.基因集数据库格式(.gmx、.gmt、.grp、.xml(这个貌似可以利用MSigDB数据库));

4.微列阵芯片注释格式(.chip);

5.基因的排名列表(.rank)

aab54b359c4247c467ed8954e75639ed.png
格式类型

1.表达式数据格式

1.1
GCT

如果要同时用于GenePattern和GSEA分析的话,需要将不同平台的表达式数据格式统一为.gct格式。一般是从纯文本文件(.txt、.csv)开始进行目标格式的转换,将其以excel打开,然后根据要求对格式的内容进行更改后再保存为gct格式的文件。gct文件格式只允许一行标识符。注:GenePattern里面有直接进行格式转换的模块。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值