官方使用手册: https://gitee.com/singleron-rd/celescope/wikis/
一、下载软件
git clone https://gitee.com/singleron-rd/celescope.git
cd celescope
conda create -n celescope
conda activate celescope
conda install --file conda_pkgs.txt --channel conda-forge --channel bioconda --channel r --channel imperial-college-research-computing
#两个镜像选择其中一种一安装
pip install -i https://pypi.douban.com/simple celescope
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple celescope
二、开始分析
1、首先建一个my_mapfile文件,格式如下:
这是一个tab分割的文件,其中第一列表示fastaq的前缀,这里要注意最多每个前缀只能有两个fastaq文件,不然会报错:无效的fastaq格式,第二列是文件的储存路径,第三列是样本名。
2、快速构建我们需要跑的代码
cd #进入需要储存分析结果的位置
multi_rna\
--mapfile /mnt/data3/my_mapfile\#my_mapfile的储存位置
--chemistry auto\
--genomeDir /mnt/MusMus/release101 \#参考基因组的位置
--thread 8\#进程
--mod shell
这时候会在自己的储存位置生成一个shell文件,进入文件会有许多***.sh***结尾的文件,如下图:
任意打开其中的一个文件:
会发现这些就是我们进行质控需要跑的代码
3、实现上面生成的代码
cd #进入需要储存分析结果的位置
如何实现上述***.sh***文件的代码,当文件只有一两个的时候,可以一个一个bash,但是文件较多时,用bash就显得很麻烦了,此时可以构建循环语句实现。
首先我们需要创建一个name.txt文件,里面包含了所有样本名。(为了快速跑完,可以用tmux多开几个窗口,构建几个name.txt)
for i in `cat name.txt`
do
sh ./shell/$i.sh 2>./log/$i.log.txt
done
其中2>就是将标准出错重定向到某个特定的地方,以方便我们后续检查有没有出错。