标题read count、标准化
确定gene的表达量就是把一段gene的rna逆转录的cdna打碎成片段,这些小片段会匹配到gene序列上,多少个reads就是counts,就是gene的表达量。但是count受gene长度和测序深度的影响。
![样本A中gene的表达量是样本B的两倍,但是这是由测序深度引起的结果,而非真实存在的差异。](https://img-blog.csdnimg.cn/c192815ce94548e78b74590301df98fd.png)
样本A中gene的表达量是样本B的两倍,但是这是由测序深度引起的结果,而非真实存在的差异。
![在这里插入图片描述](https://img-blog.csdnimg.cn/56db4c41df18418a9033fe60f693a794.png)
基因X和Y的真实表达量是一致的,但是基因X的reads会比Y的多,这是由于X基因长度更长导致的。
只想了解每个gene被覆盖到的相对reads数,而不做gene长度矫正![在这里插入图片描述](https://img-blog.csdnimg.cn/09d784225636454495536efee77e09aa.png)
都做
![在这里插入图片描述](https://img-blog.csdnimg.cn/a0c09e5b7d5549b48045356de48ce94b.png)
这个人讲的挺好,有例子