表达矩阵:1.芯片2.rna-seq
rna seq:bulk vs single cell for heterogenous异质性
第一步 alignment
spliced alighnment: hisat2 STAR unique mapped 比对的位置只有一个
第二步 quantificantion
判断reads在哪个位置表达
第三步normalization
sequence reads = expression levels
同一样本不同基因的长度不同,同一基因不同样本的测序深度不同因此需要标准化。
RPKM 除以原始片段长度
TPM 除以长度化之后片段的长度 ***正确
内参基因 TMM假设大多数基因没有差异表达
第四步可视化
差异表达
富集分析
聚类、相关系数