### 1. 关于热图的用途(参考http://www.360doc.com/content/17/0729/17/45848444_675155815.shtml)
以RNA-seq为例,热图可以:
1)直观呈现多样本多个基因的全局表达量变化;
2)呈现多样本或多基因表达量的聚类关系。
第一个问题很容易理解,毕竟使用颜色(例如红绿的深浅)来展示多个样本多个基因的表达量高低,既直观又美观。
第二个问题,则需要考虑:你是否要做聚类,是对样本聚类还是对基因聚类。
热图软件都可以选择对绘图数值进行标准正态分布化(Z score)。也就是将一组值通过均一化,使其符合均值为0,方差为1的标准正态分布。
软件: ggplot2 pheatmap
## 2 otu输入文件的处理
文述:由QIIME+USearch生成的otu 表记录的是count 数,将文件作为heatmap 的输入文件时,需要做标准化的处理。
表的处理: colname : 样本名; rowname: 物种名 ,
标准化:
rrarefy()
decostand()
相对丰度:
prop.table()
## 1 输入数据说明
head(data)
sample1 sample2 sample3
sp1 相对丰度
sp2
sp3
sp4
(即计算sp1 在每一列的比例的百分比用函数prop.table(as.matrix(mytable),2))
## log均一化
dataLog=log2(data+1)
## pheatmap显示列的分组信息输入参数的设置
annotation_col = data.frame(group=group$group)
rownames(annotation_col) = colnames(dataLog)
## 绘图
pheatmap(dataLog, cluster_row = FALSE, annotation_col = annotation_col)