HiC-Pro的Singularity简明使用指南

关于原理部分和更详细的介绍,见HiC-Pro: Hi-C数据预处理高效工具, 这里只介绍如何快速使用Singularity的HiC-Pro进行数据分析。

关键内容就是,config-hicpro.txt 里的文件路径信息都必须是绝对路径,否则默认都位于annotation目录下。切记,切记,切记。

第零步: Singularity的HiC-Pro镜像下载,

# 下载
mkdir -p /opt/biosoft/HiC-Pro 
cd /opt/biosoft/HiC-Pro 
wget https://zerkalo.curie.fr/partage/HiC-Pro/singularity_images/hicpro_latest_ubuntu.img
# 使用
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -h

第一步:建立输入数据文件夹, 数据不能是软连接形式,只能是复制或者移动

mkdir -p fastq/xxx
cp xxx_R1.fastq.gz xxx_R2.fastq.gz  fastq/xxx/
# 如果有多个样本
mkdir -p fastq/yyy
cp yyy_R1.fastq.gz yyy_R2.fastq.gz  fastq/yyy/

第二步:创建参考数据库,需要修改ENZYME

ENZYME=DpnII
# build reference
mkdir reference
mv 你的参考序列.fasta  reference/genome.fa
# enzyme site
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \
    /usr/local/bin/HiC-Pro_2.11.4/bin/utils/digest_genome.py -r $ENZYME \
    -o reference/genome_${ENZYME}.bed reference/genome.fa
# genome size
seqkit fx2tab -nl reference/genome.fa | awk '{print $1"\t"$2}' > reference/genome.chrom.size
# bowtie/2.3.4.3
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \
    bowtie2-build --threads 60 reference/genome.fa reference/genome

第三步: 复制配置文件并修改

# config
singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img \
  cp /usr/local/bin/HiC-Pro_2.11.4/config-hicpro.txt  config-hicpro.txt

修改其中的如下项,

  • N_CPU=80 线程数
  • BOWTIE2_IDX_PATH: 必须是绝对路径,例如 /home/xzg/reference
  • REFERENCE_GENOME=genome
  • GENOME_SIZE=必须是绝对路径, 例如/home/xzg/reference/genome.chrom.size
  • GENOME_FRAGMENT= 必须是绝对路径 例如/home/xzg/reference/genome_DpnII.bed
  • LIGATION_SITE=根据实际酶切位点来, 例如DpnII和MBoI都是GATCGATC

第四步:运行

singularity exec /opt/biosoft/HiC-Pro/hicpro_latest_ubuntu.img HiC-Pro -i fastq -o results -c config-hicpro.txt ```
Hi-C-Pro是一款用于处理高通量测序得到的Hi-C数据的工具,它的安装在Linux系统上通常需要几个步骤: 1. **获取最新版本**:首先,你需要从HiC-Pro的官方GitHub仓库下载最新的源码包。访问https://github.com/aidenlab/hicpro,克隆或下载zip文件到你的Linux服务器。 ```bash git clone https://github.com/aidenlab/hicpro.git ``` 2. **构建环境设置**:安装必要的依赖,如Python、C++编译器、Boost库等。对于一些高级计算功能,可能还需要CUDA和OpenMPI。在Ubuntu或Debian上,可以运行以下命令安装基本依赖: ```bash sudo apt-get install python3-dev libboost-program-options-dev libzmq3-dev \ libbz2-dev zlib1g-dev openmpi-bin ``` 3. **编译安装**:进入项目目录,然后创建一个构建目录并配置安装。例如: ```bash cd hicpro mkdir build cd build cmake .. make ``` 4. **检查安装**:如果编译成功,你可以通过`./bin/hicpro --version`来确认HiC-Pro是否已经安装并能正常运行。 5. **配置路径**:为了方便后续使用,你可能需要将bin目录添加到系统的PATH环境变量中。可以编辑~/.bashrc或~/.bash_profile文件,并添加行`export PATH=$PATH:/path/to/hicpro/build/bin`。 6. **测试**:安装完成后,可以使用示例数据来测试HiC-Pro的功能,比如运行教程提供的`run.sh`脚本。 注意:由于软件版本更新频繁,上述步骤可能会有所变化,建议参考官方文档(http://aidenlab.org/hic-pro/docs/installation.html)进行操作,特别是对于特定版本的依赖管理。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值