GSEA下载的.gmt文件批量处理

本文介绍了如何处理从GSEA下载的84个.gmt文件,通过观察文件格式、使用R语言的GSA包读取文件、数据整理及删除基因介绍,最终提取出基因名。采用lapply函数进行批量读取,并通过字符长度判断来手动删除基因介绍内容。
摘要由CSDN通过智能技术生成

从GSEA下载了84个gmt文件,打算把里面的基因名整理出来。

0. 先观察一下格式

记事本打开几个个文件看了一眼,基本上都是以基因描述+基因名称展现的,中间用制表符隔开。
在这里插入图片描述

1. 数据读取

这里涉及到两个问题:
首先是.gmt文件的读取:我用了GSA包的GSA.read.gmt();
其次是批量读取的实现:我用了lapply()函数

install.packages('GSA')
library(GSA)

path <- 'D:/immune' #文件的路径
fileNames <- dir(path) #读取该路径下的所有文件名
filePath <- sapply(fileNames, function(x){
   paste
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值