单细胞质控：Singleron CeleScope使用方法

最新推荐文章于 2025-06-10 13:17:09 发布

原创最新推荐文章于 2025-06-10 13:17:09 发布 · 1.5k 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#linux

本文介绍了如何从GitHub克隆并安装Celescope软件，通过my_mapfile文件进行RNA-seq分析，以及如何批量执行shell脚本进行质控。重点讲解了创建mapfile和使用多线程批量处理的方法。

官方使用手册： https://gitee.com/singleron-rd/celescope/wikis/

一、下载软件

git clone https://gitee.com/singleron-rd/celescope.git

cd celescope
conda create -n celescope
conda activate celescope
conda install --file conda_pkgs.txt --channel conda-forge --channel bioconda --channel r --channel imperial-college-research-computing

#两个镜像选择其中一种一安装
pip install -i https://pypi.douban.com/simple celescope
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple celescope

二、开始分析

1、首先建一个my_mapfile文件，格式如下：

在这里插入图片描述
这是一个tab分割的文件，其中第一列表示fastaq的前缀，这里要注意最多每个前缀只能有两个fastaq文件，不然会报错：无效的fastaq格式，第二列是文件的储存路径，第三列是样本名。

2、快速构建我们需要跑的代码

cd #进入需要储存分析结果的位置
 multi_rna\
  --mapfile /mnt/data3/my_mapfile\#my_mapfile的储存位置
  --chemistry auto\
  --genomeDir /mnt/MusMus/release101 \#参考基因组的位置
  --thread 8\#进程
  --mod shell

这时候会在自己的储存位置生成一个shell文件，进入文件会有许多***.sh***结尾的文件，如下图：
在这里插入图片描述
任意打开其中的一个文件：

会发现这些就是我们进行质控需要跑的代码

3、实现上面生成的代码

 cd #进入需要储存分析结果的位置

如何实现上述***.sh***文件的代码，当文件只有一两个的时候，可以一个一个bash，但是文件较多时，用bash就显得很麻烦了，此时可以构建循环语句实现。

首先我们需要创建一个name.txt文件，里面包含了所有样本名。（为了快速跑完，可以用tmux多开几个窗口，构建几个name.txt）

 for i in `cat name.txt`
 do
 sh ./shell/$i.sh 2>./log/$i.log.txt
 done

其中2>就是将标准出错重定向到某个特定的地方，以方便我们后续检查有没有出错。