RNA-seq生信分析流程(简版)

RNA-seq是近些年发展起来的针对转录组的测序技术,其能够获得mRNA、smallRNA以及各种非编码RNA的序列。在不同细胞或者在相同细胞的不同发育阶段细胞中这些RNA的表达水平是不同的,依赖RNA-seq测序技术对这些不同细胞进行差异表达分析,可以得出转录组层面上的表达模式,当前已广泛应用于基础研究、临床诊断和药物研发等领域。


1.数据质控

由于当前的测序方法需要再测序样品的两端加上接头,以便于进行大量非特异性扩增以及高通量测序,因此测序结果首先要进行去接头和质控处理。数据质控即包括去接头和质控处理两部分,可以进行数据质控的工具有FastQC、cutadaptor、Trimmomatic、Trim galore等,其中较常见的是Trim galore。

2.mapping

进行数据质控后需要将获得的序列mapping回基因组,用于mapping的工具也有很多如tophat、Bowtie、hisat2、BWA等。几个工具正hisat2和Bowtie使用较多,Bowtie使用时较为节省内存并且超级快速,其并不只是一个简单的拼接工具,其适合的工作是将小序列mapping到大基因组上。hisat2速度也很快,也较为常用。

3.确定RNA丰度

确定各种RNA的丰度是非常重要的。不同样品间可以使用TMM值、upper quartile值来计算,同种样品则可以使用RPKM、quantile值进行比较。可以使用的工具有htseq-count或stringtie、Bedtools、GFold等。

4.差异基因表达分析

差异表达分析用于确定各RNA表达差异是否有显著性,差异分析的工具有CuffDiff、DEseq、EdgeR等,每种工具都有一定的特点如CuffDiff更适合于不同样本间的比较,而另外两种更适合于相同样本的比较。获取到差异分析结果后,还可以选择使用GO分析或者KEGG通路分析进行后续分析,用于确定这些差异表达代表的生物学意义。

叮!

当前除了RNA-seq外还有sRNA-seq、miRNA-seq、chip-seq、甲基化测序等测序技术,但是这些测序技术后续的生信处理的原理基本相似。本文仅非常简要地介绍了一下RNA-seq的大体步骤,很多细节信息未涉及,技术实现也未涉及到,因为现在还没做过这方面的课题,仅仅是记录一下之前课上学到的内容。以后若是有做到相关内容再更新吧!!!

  • 4
    点赞
  • 48
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值