使用集合映射和关联关系映射_使用R进行基因ID映射

使用集合映射和关联关系映射

Inter-conversion of gene ID’s is the most important aspect enabling genomic and proteomic data analysis. There are multiple tools available each with its own drawbacks. While performing enrichment analysis on Mass Spectrometry datasets, I had always struggled to prepare the input files required for each of the packages in R. It takes some data tweaking and cleanup to enable the R tools or packages to accept them as an input. The struggle is more in case of UniProt id’s as very few applications accept them as input. Although UniProt provides the retrieve id mapping function, it does not take into account the number of rows which means any protein or gene id which cannot be mapped is simply omitted from the output file. This makes combining the datasets difficult.

基因ID的相互转换是实现基因组和蛋白质组数据分析的最重要方面。 有多种可用的工具,每种工具都有其自身的缺点。 在对质谱数据集进行富集分析时,我一直在努力准备R中每个程序包所需的输入文件。需要进行一些数据调整和清理,以使R工具或程序包可以将它们作为输入来接受。 在UniProt id的情况下,斗争更加艰巨,因为很少有应用程序接受它们作为输入。 尽管UniProt提供了检索ID映射功能,但它没有考虑行数,这意味着从输出文件中会省略掉无法映射的任何蛋白质或基因ID。 这使得难以合并数据集。

There are numerous tools available for such kind of ID mapping. Here I am laying out a few R packages that I have used and worked smoothly.

有许多工具可用于此类ID映射。 在这里,我将介绍一些我使用和顺利工作过的R软件包。

  1. AnnotationDbi package

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值