差异基因分析筛选出差异基因表达矩阵

setwd("C:/Users/linqingquan/Desktop/GSE_121787");
Sys.setlocale('LC_ALL','Chinese');

GPL_table = read.table('GPL21185-21174.txt',sep="\t",comment.char="#",
                       stringsAsFactors=F,header=T,fill=TRUE,quote="");

GSE_matrix <- read.table('GSE121787_series_matrix.txt',sep="\t",comment.char="!",
                         stringsAsFactors=F,header=T,fill=TRUE);
ID_Sybmol = GPL_table[,c(1,6)];
colnames(ID_Sybmol)[2]="Symbol";

Exp=merge(ID_Sybmol,GSE_matrix,by.x="ID",by.y="ID_REF",all=T);
Exp=Exp[,-1];
View(Exp)

Exp=Exp[Exp$Symbol != "",];
Exp=na.omit(Exp);

Exp1=data.frame(Exp[-grep("/",Exp$"Symbol"),]);
meanfun <- function(x) {
  x1 <- data.frame(unique(x[,1]));
  colnames(x1) <- c("Symbol");
  for (i in 2:ncol(x)) {
    x2 
  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
GSE39582是一个公共基因表达数据集,它包含了结直肠癌和正常组织的基因表达数据。筛选结直肠癌GSE39582差异表达基因的代码需要以下几个步骤: 1. 下载GSE39582数据集并提取差异基因表达数据。 可以使用R/Bioconductor中的GEOquery包进行下载和处理。具体代码如下: ``` library(GEOquery) gse <- getGEO("GSE39582") eset <- gse[]$exprs pdata <- pData(gse[]) target <- as.character(pdata$characteristics_ch1.4) cancerIndex <- which(target == "tumor") normalIndex <- which(target == "normal") #使用limma包获取差异表达基因 library(limma) #创建样本信息矩阵 group <- c(rep("cancer", length(cancerIndex)), rep("normal", length(normalIndex))) design <- model.matrix(~group) colnames(design) <- c("intercept", "group_normal") fit <- lmFit(eset, design) fit <- eBayes(fit) topTable(fit, coef="group_normal", adjust.method="BH", sort.by="B", number=1000) ``` 2. 对差异基因进行生物信息学分析。 一旦确定了差异表达基因,可以使用一些生物信息学工具来进一步分析它们的生物学意义。这些工具包括Gene Ontology(GO)和KEGG Pathway分析等。可以使用R中的clusterProfiler包对差异基因进行生物信息学分析,代码如下: ``` library(clusterProfiler) library(org.Hs.eg.db) #将差异基因转换为Ensembl ID ensemblID <- select(org.Hs.eg.db, keys=topGenes, columns=c("ENSEMBL"), keytype="SYMBOL") #进行GO分析 goEnrichment <- enrichGO(ensemblID$ENSEMBL, OrgDb=org.Hs.eg.db, ont="BP", pvalueCutoff=0.05, pAdjustMethod="BH") head(goEnrichment@result) #进行KEGG分析 keggEnrichment <- enrichKEGG(ensemblID$ENSEMBL, OrgDb=org.Hs.eg.db, pvalueCutoff=0.05, pAdjustMethod="BH") head(keggEnrichment@result) ``` 以上是对筛选结直肠癌GSE39582差异表达基因的代码介绍,希望对您有所帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值