rMATs 可变剪切及rmats2sashimiplot可视化安装与使用
一、安装及使用
用conda安装:
conda install -c bioconda rmats=4.0.2
(要用4.0.2的版本做,才可以跑出结果)
检查是否安装上:rmats.py -h
如果出现帮助文档,即可运行使用
(1)将bam文件传输到b1.txt和b2.txt中(传输时,各个bam文件之间用逗号隔开,但不能放空格,用英文逗号,bam文件需要用到hisat2 比对出来的,只能用bam文件可以出结果)
echo 231ESRP.25K.rep-1.bam,231ESRP.25K.rep-2.bam > b1.txt
echo 231EV.25K.rep-1.bam,231EV.25K.rep-2.bam > b2.txt
(2)用rmats软件运行跑结果
rmats.py --b1 b1.txt --b2 b2.txt --gtf /data/gs/data/data1/reference/gtf/Annotation/Mus_musculus.GRCm38.102.gtf --od output -t paired --nthread 6 --readLength 125 --tmp out --nthread 6 --novelSS
–statoff :跳过统计分析 (这个参数尽量不要使用,不然的话,FDR和Pvalue的值就没有了)
–novelSS:预测新的可变剪切事件
b1.txt:为bam文件,内容为各个bam文件的路径/bam文件名,不同bam文件之间用,隔开;(实验组)
b2.txt:为bam文件,内容为各个bam文件的路径/bam文件名,不同bam文件之间用,隔开;(对照组)
–od:输出文件夹的名字ss
-t:单双末端 单末端:single ,双末端:paired
–nthread:线程
–readlength:reads长度,这个长度可以在fastqc质控报告中查看sequence length
后台运行:(hisat2比对)
touch hisat2.sh #创建hisat2.sh
vim hisat2.sh #打开创建好的hisat2.sh
在vim中写入程序:
for i in $(ls *_1_val_1.fq.gz)
do
i=${i/_1_val_1.fq.gz/}
# echo $i
hisat2 --dta -t -p 20 -x /data/gs/data/data1/reference/references/Mus/GRCm38/mm10/mm10 -1 ${i}_1_val_1.fq.gz -2 ${i}_2_val_2.fq.gz -S ./nohupsam/${i}.sam
done
esc退出编辑模式,:wq保存
chmod+x hisat2.sh #给hisat2.sh权限
nohup ./hisat2.sh & #后台运行,会出现一个nohup.out的文件,运行输出结果都在其中显示,后期可以参考
jobs -l #查看后台运行的命令
kill -9 进程号 # 彻底删除
kill -STOP 1234 (进程号 ) # 暂停进程
kill -CONT 1234(进程号 ) # 重启进程