上一篇博文记录了hicpro在服务器的安装教程,各种依赖都是手动安装,这篇换了一种方法实现,原理都是一样的。
这篇文章从头到尾亲自实现并成功。
先确保安装好anaconda
1. 下载并解压安装包(/student2/software)
wget -c http://github.com/nservant/HiC-Pro/archive/refs/tags/v3.1.0.tar.gz
tar -zxvf HiC-Pro-3.1.0.tar.gz
2. 创建虚拟环境
conda env create -f /student2/software/HiC-Pro-3.1.0/environment.yml -n nehic
3. 进入HiC-Pro-3.1.0配置config-install.txt
vi config-install.txt
4. 执行make configure命令
此时多了一个config-system.txt
5. 查看这个文件
6. 执行make命令安装成功
7. 配置环境变量(退出虚拟环境)
vi ~/.bashrc
任意路径下输入HiC-Pro,都会输出使用信息
8. 下载参考基因组
wget ftp://ftp.ensemblgenomes.org/pub/bacteria/release-40/fasta/bacteria_20_collection/caulobacter_crescentus_na1000/dna/Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa.gz
gunzip Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa.gz
bowtie2-build Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa bacteria
9. 获取genome.sizes文件
samtools faidx Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa
awk '{print $1 "\t" $2}' Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa.fai > genome.sizes
10. 指定酶切位点得到bacteria.bed文件
bin=/student2/software/hicpro/bin/HiC-Pro_3.1.0/bin/utils/digest_genome.py
$bin -r C^CATGG -o bacteria.bed Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa
11. 配置config-hicpro文件,复制到hictest项目文件夹下
12. conda 安装 aspera(用于快速下载数据)
ascp -v -QT -l 300m -P33001 -k1 -i /student2/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR824/SRR824846/SRR824846_1.fastq.gz ./
13. 最后运行(在hictest目录下)
HiC-Pro -i data -o out -c config-hicpro.txt
14. 结果
如有问题欢迎批评指正!
参考博客
HiC数据分析实战之Hic-pro-腾讯云开发者社区-腾讯云 (tencent.com)
参考基因组及注释下载 - 简书 (jianshu.com)
生信 | 三维基因组技术(三):Hi-C 数据比对及HiC-Pro的使用 - 简书 (jianshu.com)