1. 什么是差异表达基因
在不同组织中表达发生明显变化的基因
是导致细胞状态发生变化的关键基因
是表达谱分析的主要对象
2. 寻找差异表达基因的两种方法
倍数变化阀值(一般设置为2倍)
具体方法:
找出所有基因的表达变化率
按照表达变化率排序
上调两倍或者下调两倍算作差异表达基因
适合条件:实验重复数极少
差异基因数目比例(top5%, 即最上调的2.5%,最下调的2.5%)
用假设检验来做
3. R 语言实现
这个实验作者想知道用Infliximab 治疗溃疡性结肠炎 有应答组合无应答组的基因表达差异
3.1 材料准备
1.下载“GSE12251” 23个项目
image.png
制作一个target.txt 文件
相当于记录临床信息,12 个为应答组,11个为无应答组
image.png
下载“anonotation.csv”
去 affy 官网下载,下载下来的是"HG-U133_Plus_2.na36.annot.csv", 需要整理如下
image.png
3.2 R 代码
library(affy)
library(limma)
##import phenotype data
phenoData = read.Ann