rmats4.1.2最全使用攻略

最新推荐文章于 2024-09-12 09:11:48 发布

鸭鸭生信助手

最新推荐文章于 2024-09-12 09:11:48 发布

阅读量1.2k

点赞数 2

分类专栏：可变剪切分析-rmats4.1.2 文章标签： python

本文链接：https://blog.csdn.net/yaya_bioinfo/article/details/130938192

版权

可变剪切分析-rmats4.1.2 专栏收录该内容

4 篇文章 1 订阅

订阅专栏

本文介绍了如何运行RMATS进行可变剪接分析，强调了从bam文件开始、正确构建txt文件、避免路径问题以及参数设置等关键步骤，并提供了RMATS命令行示例。建议使用绝对路径，并注意线程使用和cutoff值的选择。文章还提醒读者，如遇到问题，作者愿意提供帮助。

摘要由CSDN通过智能技术生成

rmats的运行代码虽然简单，但是方方面面需要注意的细节可不少！

1. 如果手上没有bam文件，鸭鸭这边建议先单独使用star跑一份bam文件出来，而不是直接从fastq开始，这样速度特别慢。而且如果不是原生ubuntu20.04而是使用wsl的话，star和rmats可能会有冲突，需要在不同环境跑。

2. 得到bam文件后，如果每个组的重复大于1，建议建立txt文件来储存bam文件的路径，这样更清晰明了一些。

3. 关于这个txt文件，切记，各个bam文件仅仅以,分隔，千万不要是有多余的空格，不然无法成功读取bam文件。在路径中也不要使用~，否则也无法读取bam文件。无法读取bam文件，就会导致没有rmats结果，空空如也。下面是一个txt文件的小例子。

/path_to_txt/exp1.bam,/path_to_txt/exp2.bam,/path_to_txt/exp3.txt

4. 弄好txt文件之后，就可以运行rmats的代码啦，下面是一个小例子。

python /path_to_rmats/rmats-turbo-master/rmats.py --b1 /path_to_txt/exp.txt --b2 /path_to_txt/ctrl.txt --gtf /path_to_gtf/annotation.gtf --tmp /path_to_tmp/tmp_dir -t paired --nthread 8 --tstat 10 --cstat 0.0001 --readLength 150 --novelSS --od /path_to_save/rmats_output

对以上用到的参数进行一些简短的说明，以下涉及到的路径都推荐使用绝对路径~

--b1：实验组bam文件的txt文件的路径。

--b2：对照组bam文件的txt文件的路径。

--gtf：储存gtf的文件路径，注意和建立star index使用的gtf要相同。

--tmp：储存生成的临时文件的路径，不需要提前建好。

-t：指定测序数据是paired还是single。

--nthread：运行的线程，注意不要超过自己电脑硬件的线程，并至少留一个。

--tstat：差异分析时运行的线程，注意事项同上。

--cstat：可变剪切的cutoff，一般建议设小一点，比如0.0001（默认值），毕竟后期可以再过滤掉差异小的。0.0001就是说两组之间的差异至少有0.01%。

--readLength：测序片段长度，现在一般都是150，可咨询测序公司double check。

--novelSS：是否检测新的剪切形式，不检测可以不加这个参数。

--od: 储存rmats结果的路径，注意这个文件夹需要提前建好。