GEO数据预处理(下)

通过4天时间详细学习并实践了GEO数据预处理过程,阅读源代码提升了对数据理解的深度。在实践中遇到PCA图添加椭圆的错误,经过排查发现行名中的特殊字符导致,同时也发现行名仅包含数字也会引发问题。通过分享这些经验,期望促进共同学习和进步。
摘要由CSDN通过智能技术生成
memory.limit(248000)
rm(list=ls())#清除当期环境变量
setwd('C:\\Users\\lenovo\\Desktop\\GSE55696\\ann')
library(reshape2)
library(knitr)
library(ggfortify)
library(cluster)
library(ggplot2)
group_list=c(rep("CG",times=19),rep("LGIN",times=19))#分组
a2= read.csv("C:\\Users\\lenovo\\Desktop\\GSE55696\\ann\\a2.csv")#表达矩阵
a2=a2[,2:39]


colnames(a2)[1]="symbol"#列名命名
a3=melt(a2)
#kable(data,format="markdown") #kable函数就是显示所有的内容数据
#a4<-melt(a2,id.vars=c("symbol"),variable.name="sample",value.name="values")  数据变形
#colnames(exp_L)=c('symbol','sample','value') 命名列名
a4$group = rep(group_list,each=nrow(a2))#a4增加一列group,复制


library(limma) 
a3 = normalizeBetweenArrays(a3[3:3])#对表达量进行标准化消除批次差异,从图中可以看到两个分组control和treat基本在一条线上,这样的数据说明可以进行后续比较,如果不在一条线上说明有批次效应batch infect,需要用limma包内置函数normalizeBetweenArrays人工
  • 3
    点赞
  • 22
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值