geo差异表达分析_不会编程玩转表达差异分析,用GEO2R就可以!

本文介绍了GEO2R作为官方认可的不编程差异表达分析工具,适用于GEO数据库中的系列数据,用于比较不同样本组的基因差异表达。尽管它不适用于所有类型的数据(如测序数据),但为需要快速分析的用户提供了一个方便的选择。
摘要由CSDN通过智能技术生成

官方认定的不编程差异分析工具。

83b10d5b93357e3cccc80cf58d800beb.png 众所周知,如何在浩如烟海的分子中做出取舍,并真正确定分子主变量,是科研启航至关重要的一步。而酸菜老师的筛猜二字决,就是基本敲定一个候选分子的不二法宝。 芯片作为高通量数据筛选的最常见技术平台之一可提供成千上万的基因表达量变化。鉴于这上万的基因不一定都参与疾病的发生,因而从芯片数据中找寻候选分子,就要进行差异基因表达分析。 《生信体系课-上篇》段位一的知识模块02将针对此问题进行具体的阐述,其中的第一节课先是简要介绍了芯片标准分析流程,其次第二节课则讲解了GEO数据库在线工具GEO2R的具体使用方法。

01

在第一课《芯片标准分析流程》中,R语言是生信分析的基础,在线数据库差异分析也大多基于R语言Limma包,因此本模块第一节课则简单介绍了基于R语言的芯片标准分析流程,包括相关准备工作的完成、数据的预处理、差异基因分析和可视化。 21ff13d008ea721fdc90aef582670d61.png ea2a5211424af6cb62370fd4ef7686e4.png 803680adb55752aa33239c8b829ba201.png

随后,课程中也比较了芯片在线分析流程与R语言分析流程的异同。

da09b9b5481c6aa09f3e7aa13cb46ab1.png

其次,课程简要介绍了3个芯片分析数据库:NetworkAnalyst、GEO和GCBI数据库,学员们在了解这三个数据库的优缺点后,根据自己的科研需求选择合适的数据库进行芯片数据分析。

a2a6bce250f0f112a488a231838de941.png f9fd734eef7ede762fa591acf875f24c.png 6c5df6cc05dcecf20bb545c3059add5d.png

02

GEO2R是GEO数据库提供的在线工具,主要用于比较2组或多组样本,以获得差异性表达的基因。

GEO 2R主要是对系列数据(series)进行分析,但不是所有系列数据都能用GEO2R工具进行分析,比如测序数据就不能使用GEO2R,对于这类数据,工具栏中的“Analyze with GEO2R”按钮不会显示。

课程以肺癌相关基因表达谱为例,具体讲解了基因表达数据库GEO的分析工具GEO2R的具体使用方法以及数据解读。 1.GEO2R操作方法

284aa88b0559b6cb0afc1721fff8ff68.png5ea73c4df25af372ddfb2bff1ae2ef19.pngd0961aebf08c22ecc722375da96a5187.pngd72cada9448c817df81e005d8036634f.png

2.GEO2R数据解读

3faa5c2b60c1a8968e974f72fea9481d.pngcc42447738a87b07f6e16e77acfdd522.png5be8fb7ae9019c5829a3736f118f39ae.png

另外,课程也通过实例操作演示GEO2R工具的具体流程,同时也介绍了如何利用GEO2R获取变化幅度大且有统计学意义的基因群、以及多组间差异分析的具体过程。 学员们可快速学会两组或多组样本的差异表达分析,以及表达图谱的可视化显现。 e2999b22d98b778221598574b108cd99.png 636d0c1b3762acf739cd433f7e3796ba.png 685482cd14eb1c7e815928c5ad3860e0.png 83b10d5b93357e3cccc80cf58d800beb.png
  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
差异表达分析是一种常用的方法,用于比较不同条件下基因表达水平的变化。GEOquery和limma是R语言中广泛使用的两个包,可用于处理和分析芯片数据的差异表达。下面是使用GEOquery和limma进行差异表达分析的步骤: 1. 下载和导入芯片数据 使用GEOquery包中的getGEO函数下载芯片数据并导入到R中。例如,如果您要下载GSE12345数据集,可以使用以下代码: ``` library(GEOquery) gset <- getGEO("GSE12345") ``` 2. 数据质量控制 在进行差异表达分析之前,需要对数据进行质量控制。使用GEOquery包中的summary函数和plotPCA函数可以对芯片数据进行基本的质量控制。例如,可以使用以下代码绘制PCA图: ``` library(limma) library(GEOquery) gset <- getGEO("GSE12345") edata <- exprs(gset[[1]]) edata <- t(edata) edata <- na.omit(edata) fit <- prcomp(edata) plotPCA(fit) ``` 3. 数据预处理 对芯片数据进行归一化和标准化处理,以消除不同芯片之间的差异,并确保数据符合正态分布。常用的预处理方法包括RMA、GCRMA、MAS5等。使用limma包中的normalizeBetweenArrays函数可以对芯片数据进行预处理。例如,可以使用以下代码对芯片数据进行RMA预处理: ``` library(limma) library(GEOquery) gset <- getGEO("GSE12345") edata <- exprs(gset[[1]]) edata <- t(edata) edata <- na.omit(edata) edata <- backgroundCorrect.RMA(edata) edata <- normalize.quantiles.RMA(edata) edata <- log2(edata) ``` 4. 差异表达分析 使用limma包中的lmFit函数和eBayes函数可以进行差异表达分析。lmFit函数用于拟合线性模型,eBayes函数用于对差异表达结果进行统计显著性检验。例如,可以使用以下代码进行差异表达分析: ``` library(limma) library(GEOquery) gset <- getGEO("GSE12345") edata <- exprs(gset[[1]]) edata <- t(edata) edata <- na.omit(edata) edata <- backgroundCorrect.RMA(edata) edata <- normalize.quantiles.RMA(edata) edata <- log2(edata) factors <- c(0,0,0,1,1,1) design <- model.matrix(~factors) fit <- lmFit(edata, design) fit <- eBayes(fit) results <- topTable(fit, adjust="BH", sort.by="P", n=1000) ``` 上述代码中,factors表示芯片数据中不同样本的分组信息,design表示设计矩阵,fit表示拟合的线性模型,results表示差异表达结果。 5. 结果分析 根据差异表达结果,可以进行进一步的功能分析、通路分析等。常用的工具包括ClusterProfiler、GOstats、KEGGprofile等。例如,可以使用以下代码进行GO分析: ``` library(ClusterProfiler) gset <- getGEO("GSE12345") edata <- exprs(gset[[1]]) edata <- t(edata) edata <- na.omit(edata) edata <- backgroundCorrect.RMA(edata) edata <- normalize.quantiles.RMA(edata) edata <- log2(edata) factors <- c(0,0,0,1,1,1) design <- model.matrix(~factors) fit <- lmFit(edata, design) fit <- eBayes(fit) results <- topTable(fit, adjust="BH", sort.by="P", n=1000) genes <- rownames(results) geneList <- names(genes) geneList <- names(genes)[abs(results$logFC) > 1 & results$adj.P.Val < 0.05] ego <- enrichGO(geneList, OrgDb="org.Hs.eg.db", ont="BP") barplot(ego) ``` 上述代码中,geneList表示差异表达基因列表,ego表示进行GO分析所得到的富集结果。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值