seqkit根据基因id_gpl16699平台的探针注释到基因名

本文介绍了如何处理没有bioconductor包的GPL16699平台数据,通过两种方法:使用GEOquery R包或下载txt文件进行探针注释。详细步骤包括从NCBI官网获取信息,使用getGEO函数或直接读取txt文件,以完成探针到基因名的注释。后续内容涉及生信技能树的B站系列教学视频。
摘要由CSDN通过智能技术生成
最开始分享过芯片探针注释到基因名的3种方法:
  • 1金标准当然是去基因芯片的厂商的官网直接去下载
  • 2一种是直接用bioconductor的包
  • 3一种是从NCBI里面下载文件来解析

见原文

现在我完成作业就遇到了gpl16699平台,它并没有bioconductor的包,所以需要下载gpl平台的soft文件,进行注释,官网https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL16699 可以看到信息如下:

7af4737f07c8c6080dc57e1cc88e27a8.png

现在使用r代码完成这个步骤

方法一:使用GEOquery包

rm(list = ls())  ## 魔幻操作,一键清空~
options(stringsAsFactors = F)
library(GEOquery)
gpl=getGEO("GPL16699",destdir = '.')
names(Meta(gpl))
Table(gpl)[1:10,1:2]
ids=Table(gpl)[,c("NAME","GENE_SYMBOL")]
head(ids)
colnames(ids)=c('probe_id','symbol')
head(ids)

这一个方法需要网速保障,并且确保下载的GPL完整,不然会影响后面的操作。

方法二:下载txt文件

在官网https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL16699 下载txt文件

cf0de7d3d731792958add51f56fecb35.png

读取它的代码如下:

rm(list = ls())  ## 魔幻操作,一键清空~
options(stringsAsFactors = F)
gpl=read.table("GPL16699-15607.txt",
               header = TRUE,fill = T,sep = "t",
               comment.char = "#",
               stringsAsFactors = FALSE,
               quote = "")
head(gpl)
colnames(gpl)
ids=gpl[,c("NAME","GENE_SYMBOL")]
head(ids)
colnames(ids)=c('probe_id','symbol')
head(ids)

这个就是gpl16699的探针ID与基因名

43378bd7f8d03b6bd12e773c972016cf.png

对比一下,方法一里面的getGEO函数下载后使用Table提取到的内容,就是方法二的txt文件,后续处理一致。

大功告成!

后续挖掘见生信技能树B站系列教学视频

需要细读表达芯片的公共数据库挖掘系列推文 ;

  • 解读GEO数据存放规律及下载,一文就够
  • 解读SRA数据库规律一文就够
  • 从GEO数据库下载得到表达矩阵 一文就够
  • GSEA分析一文就够(单机版+R语言版)
  • 根据分组信息做差异分析- 这个一文不够的
  • 差异分析得到的结果注释一文就够

然后看B站的GEO数据挖掘技巧,基本上该分享的都在B站和GitHub了,目录如下:

  • 第一讲:GEO,表达芯片与R
  • 第二讲:从GEO下载数据得到表达量矩阵
  • 第三讲:对表达量矩阵用GSEA软件做分析
  • 第四讲:根据分组信息做差异分析
  • 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析
  • 第六讲:指定基因分组boxplot指定基因list画热图
  • 第七讲:根据差异基因list获取string数据库的PPI网络数据
  • 第八讲:PPI网络数据用R或者cytoscape画网络图
  • 第九讲:网络图的子网络获取
  • 第十讲:hug genes如何找
  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值