RNAseq生物信息分析第11课

基因差异表达筛选

  • 计算每个基因的RPKM值,通过基因表达量以区分基因差异表达
  • 下面三个案例哪种才是较大的基因差异表达呢?
    001
    通常基因差异表达有两个标准
  1. fold-change
    002

003
2. FDR校正
首先计算p-value
0096
007

cufflinks

  • 根据tophat比对结果,输入到cufflinks,依托或不依托参考基因组注释文件计算每个转录本的FPKM值,并给出注释结果。
  • 根据tophat比对结果,重新组装转录本,估计转录本的丰度,并检验样本间的差异表达和可变剪接。
  • tophat+cufflinks分析流程
    008
  • 常用选项参数

-G/–GTF 后接GTF文件,计算iso-form表达量,不会组装新的
transcript,程序只会计算序列中已有转录本的表达量
-g/–GTF-guide 指利用gtf文件作为指导,也就是将没有匹配上的reads重新拼装为新转录本,并对新转录本表达量计算。若需要寻找新转录本,则用-g
.
.
.

cufflinks案例

链接 https://study.163.com/course/courseLearn.htm?courseId=1209594947#/learn/video?lessonId=1280037982&courseId=1209594947

  • cufflinks的输入为sam或bam文件,且该输入文件为排序好的结果。tophat的输出默认是排序好的结果(若未排序,可使用samtools sort来进行排序)
  • -G计算基因表达量;-g需要拼接转录本

cuffmerge

  • 因为每次转录只是把基因中一部分进行转录,把多次转录合并起来才能得到原基因表达区域
  • 案例演示

cuffcompare

  • 比较注释文件的GTF和组装后的GTF文件、主要用于新转录本的寻找

-V显示数据处理过程
具体查看文档

cuffdif

  • 发现转录本表达、剪接;通过fpkm计算
  • 只需将tophat输出结果,输入cuffdif,即可计算表达量
  • 具体看文档
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值