16S 物种丰度热图学习

### 1. 关于热图的用途(参考http://www.360doc.com/content/17/0729/17/45848444_675155815.shtml)

以RNA-seq为例,热图可以:

    1)直观呈现多样本多个基因的全局表达量变化;

    2)呈现多样本或多基因表达量的聚类关系。

第一个问题很容易理解,毕竟使用颜色(例如红绿的深浅)来展示多个样本多个基因的表达量高低,既直观又美观。

第二个问题,则需要考虑:你是否要做聚类,是对样本聚类还是对基因聚类。

热图软件都可以选择对绘图数值进行标准正态分布化(Z score)。也就是将一组值通过均一化,使其符合均值为0,方差为1的标准正态分布。

软件: ggplot2 pheatmap

## 2 otu输入文件的处理

文述:由QIIME+USearch生成的otu 表记录的是count 数,将文件作为heatmap 的输入文件时,需要做标准化的处理。

表的处理: colname : 样本名; rowname: 物种名 ,

标准化:

rrarefy()

decostand()

相对丰度:

prop.table()

## 1 输入数据说明
head(data)
    sample1 sample2 sample3
sp1  相对丰度
sp2
sp3
sp4

(即计算sp1 在每一列的比例的百分比用函数prop.table(as.matrix(mytable),2))


## log均一化
dataLog=log2(data+1)
## pheatmap显示列的分组信息输入参数的设置
annotation_col = data.frame(group=group$group)
rownames(annotation_col) = colnames(dataLog)

## 绘图
pheatmap(dataLog, cluster_row = FALSE, annotation_col = annotation_col)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值