salmon:sailfish的升级版本

欢迎关注”生信修炼手册”!

salmon 是sailfish 的升级版,其内存消耗更少,速度更快,准确度更高。官网如下

https://combine-lab.github.io/salmon/

github提供了编译好的二进制包,下载解压缩即可。安装过程如下

wget https://github.com/COMBINE-lab/salmon/releases/download/v0.11.3/salmon-0.11.3-linux_x86_64.tar.gz
tar xzvf salmon-0.11.3-linux_x86_64.tar.gz

可执行文件的名称为salmon, 和sailfish的用法是类似的,分为indexingquantification两步。

1. indexing

基本用法如下

salmon  index \
-t hg19_refGeneMrna.fa  \
-k 31 \
-p 10 \
-i hg19_salmon_db

-t参数指定参考基因组转录本的fasta格式的文件,-k参数指定kmer的长度,-p参数指定线程数,-i参数指定索引的输出目录,在该目录下,会生成如下文件

├── duplicate_clusters.tsv
├── hash.bin
├── header.json
├── indexing.log
├── quasi_index.log
├── refInfo.json
├── rsd.bin
├── sa.bin
├── txpInfo.bin
└── versionInfo.json
2. quantification

相比sailfish, salmon能够读取gzip压缩的序列文件, 而且也支持从bam文件中读取序列,基本用法

salmon quant \
-i hg19_salmon_db \
-l IU \
-1 R1.fq.gz \
-2 R2.fq.gz \
-p 10 \
-o out_dir

-i参数指定转录本索引所在的目录,-l参数指定文库类型library type, -1-2参数用于指定双端测序的reads, 单端测序的reads用-r参数指定 ,bam格式的输入文件用-a参数指定,-p参数指定线程数,-o参数指定输出结果的目录。

在输出目录会生成quant.sf文件,保存了转录本水平的定量结果,内容如下

NameLengthEffectiveLengthTPMNumReads
NR_02454017691609.6207.074884387.930
NR_11002231873027.6200.59713761.587
NR_03338029152755.6200.89914884.404

由于读长的限制,测序reads比对的最小单位都是exon, 对于转录本的定量,直接根据各个exon的水平去计算一个最终的丰度就好了,但是对于基因水平的定量而言,由于一个基因会对应多个转录本,不同转录本的 eoxn会存在overlap,冗余等现象,所以通常的做法是根据转录本的定量结果去推算基因的表达量,这就依赖于转录本注释的完整性和准确性。

相对而言,转录本水平的定量和差异分析会更加的灵敏,所以现在很多的软件都会给出转录本水平的定量结果。

salmon只输出转录本水平的定量结果,后续的差异分析可以使用DESeq2, edgeR, limma, sleuth等软件。

·end·

—如果喜欢,快分享给你的朋友们吧—

扫描关注微信号,更多精彩内容等着你!

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值