起因
熟悉使用fastp,该软件可对双端测序数据进行trim处理。其参数中有一项为trim_poly_g。过去常做RNA-seq,知道mRNA加工时会产生polyA尾,但DNA为什么会有polyG?感到困惑。
经过
google进行百度,意外得到了fastp作者对此问题的回答,进行理解和翻译如下结果。
结果
Nextseq和Novaseq(四年前,最新机器不确定)是双色系统,在双色系统中:
- 绿色 T
- 红色 C
- 黄色(红+绿) A
- 黑色(无红&无绿) G
而当互补配对合成逐轮进行,信号强度也逐渐减弱。当信号弱到不可测时,则会被错误检测为G。所以在reads末端常见polyG。