some transcripts quantification brief comprehensions

 

 

Some biases in the standard rnaseq analysis

 

 有参拼接:Stringtie 、 Cufflinks and Traph

flow network algorithm : maximal and minimal methods respectively

 无参组装:Trinity

clustering by K-mers

salmon: as for now the best performance software 

 

DAG:有向无环图 

bagging是减少variance,而boosting是减少bias

 

High variance 是model过于复杂 overfit,记住太多细节noise,受outlier影响很大;high bias是 underfit,model过于简单,cost function不够好。
A- bagging随机选取data的subset,outlier因为比例比较低,参与model training的几率也比较低,所以bagging降低了outliers和noise对model的影响,所以降低了variance。
B-boosting参zh Bright的答案, minimize loss function by definition minimize bias.
==========================================================
==========================================================
Streaming fragment assignment for real-time analysis of sequencing experiments

流形碎片的实时测序实验

TIPS:

在估计丰度时候很容易用错或者是正确使用与否是很关键的一步:

RPKM:Reads Per Kilobase of exon modelper Million mapped reads (每千个碱基的转录每百万映射读取的reads),主要用来对单端测序(single-end RNA-seq)进行定量的方法。
RPKM= total exon reads/ (mapped reads (Millions) * exon length(KB))

 

FPKM:

Fragments Per Kilobase of exon model per Million mapped fragments(每千个碱基的转录每百万映射读取的fragments),主要是针对pair-end测序表达量进行计算

 

TPM:

Transcripts Per Kilobase of exonmodel per Million mapped reads (每千个碱基的转录每百万映射读取的Transcripts),优化的RPKM计算方法,可以用于同一物种不同组织的比较。
TPM (推荐软件,RSEM) 的计算公式:

TPMi={( Ni/Li )*1000000 } / sum( Ni/Li+……..+ Nm/Lm )

 

CPM/RPM:

Reads/Counts of exon model per Million mapped reads (每百万映射读取的reads).
RPM的计算公式:
RPM=total exon reads / mapped reads (Millions)

 

转载于:https://www.cnblogs.com/beckygogogo/p/9223911.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值