基因丰度计算
使用soap将clean data比对到非冗余的核酸序列NonRundant.gene.nucl.fasta。根据soap比对结果,获得比对到某基因的read数。Soap比对工具的使用在之前的微信推送稿中介绍过,这里就不做说明。然后,基于read数获得基因的丰度值,计算方法如下:
S1 | S2 | S3 | |
G1 | . | . | . |
G2 | . | . | . |
G3 | . | . | . |
样本i中基因j表示为SiGj, 样本i中比对到基因j的read数表示为SiGj_read,基因j长度表示为Gj_len。
相对丰度:SiGj丰度值=(SiGj_read/Gj_len)/(SiG1_read/G1_len+SiG2_read/G2_len+SiG3_read/G3_len ...)