简介
项目地址
所有的代码都会同步到此仓库,有需要的小伙伴可以前往查看
基于参考基因组的转录组分析,需要把质控后的数据比对到参考基因组上进行下游分析
一般来说有参转录组的转录本回比率不低于60%,这种情况表明参考基因组组装质量比较差,需要进行无参转录本的分析已得到更多的数据供后续分析。
比对效率指Mapped Reads占Clean Reads的百分比,是转录组数据利用率的最直接体现,如果参考基因组组装的较为完善,而且所测物种与参考基因组一致,且相关实验不存在污染,那么实验所产生的测序reads成功比对到基因组的比例会高于70% (Total Mapped)
分析流程
上游分析
主要对illumina测序(或其他测序方法)数据进行处理,得到TPM文件。
基本分析流程
- RNA-seq原始测序数据(raw data)的质量评估
- 过滤低质量序列
- 比对到参考基因组
- 基因表达定量分析
数据质控
illumina测序文件中,存在保护碱基(terminal sequence)、接头序列(adapter)、索引序列(index)、引物结合位点(Primer Binding Site),其中 adapter是和flowcell上的接头互补配对结合的;index是一段特异序列,加入index是为了提高illumina测序仪的使用率,因为同一个泳道可能会测序多个样品,样品间的区分就是通过index区分