单细胞质控:Singleron CeleScope使用方法

本文介绍了如何从GitHub克隆并安装Celescope软件,通过my_mapfile文件进行RNA-seq分析,以及如何批量执行shell脚本进行质控。重点讲解了创建mapfile和使用多线程批量处理的方法。

官方使用手册: https://gitee.com/singleron-rd/celescope/wikis/

一、下载软件

git clone https://gitee.com/singleron-rd/celescope.git
cd celescope
conda create -n celescope
conda activate celescope
conda install --file conda_pkgs.txt --channel conda-forge --channel bioconda --channel r --channel imperial-college-research-computing
#两个镜像选择其中一种一安装
pip install -i https://pypi.douban.com/simple celescope
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple celescope

二、开始分析

1、首先建一个my_mapfile文件,格式如下:

在这里插入图片描述
这是一个tab分割的文件,其中第一列表示fastaq的前缀,这里要注意最多每个前缀只能有两个fastaq文件,不然会报错:无效的fastaq格式,第二列是文件的储存路径,第三列是样本名。

2、快速构建我们需要跑的代码

cd #进入需要储存分析结果的位置
 multi_rna\
  --mapfile /mnt/data3/my_mapfile\#my_mapfile的储存位置
  --chemistry auto\
  --genomeDir /mnt/MusMus/release101 \#参考基因组的位置
  --thread 8\#进程
  --mod shell

这时候会在自己的储存位置生成一个shell文件,进入文件会有许多***.sh***结尾的文件,如下图:
在这里插入图片描述
任意打开其中的一个文件:
在这里插入图片描述
会发现这些就是我们进行质控需要跑的代码

3、实现上面生成的代码

 cd #进入需要储存分析结果的位置

如何实现上述***.sh***文件的代码,当文件只有一两个的时候,可以一个一个bash,但是文件较多时,用bash就显得很麻烦了,此时可以构建循环语句实现。

首先我们需要创建一个name.txt文件,里面包含了所有样本名。(为了快速跑完,可以用tmux多开几个窗口,构建几个name.txt)

 for i in `cat name.txt`
 do
 sh ./shell/$i.sh 2>./log/$i.log.txt
 done

其中2>就是将标准出错重定向到某个特定的地方,以方便我们后续检查有没有出错。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值