超超超完整hicpro安装和使用教程

lyyaaaaa

已于 2024-05-21 16:17:04 修改

阅读量4.5k

点赞数 16

文章标签：数据库 linux

于 2023-12-13 17:44:40 首次发布

本文链接：https://blog.csdn.net/lyyaaaaa/article/details/134976360

版权

上一篇博文记录了hicpro在服务器的安装教程，各种依赖都是手动安装，这篇换了一种方法实现，原理都是一样的。

这篇文章从头到尾亲自实现并成功。

先确保安装好anaconda

1. 下载并解压安装包（/student2/software）

wget -c http://github.com/nservant/HiC-Pro/archive/refs/tags/v3.1.0.tar.gz
tar -zxvf HiC-Pro-3.1.0.tar.gz

2. 创建虚拟环境

conda env create -f /student2/software/HiC-Pro-3.1.0/environment.yml -n nehic

3. 进入HiC-Pro-3.1.0配置config-install.txt

vi config-install.txt

4. 执行make configure命令

此时多了一个config-system.txt

5. 查看这个文件

6. 执行make命令安装成功

7. 配置环境变量（退出虚拟环境）

vi ~/.bashrc

任意路径下输入HiC-Pro，都会输出使用信息

8. 下载参考基因组

wget ftp://ftp.ensemblgenomes.org/pub/bacteria/release-40/fasta/bacteria_20_collection/caulobacter_crescentus_na1000/dna/Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa.gz
gunzip Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa.gz
bowtie2-build  Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa   bacteria

9. 获取genome.sizes文件

samtools faidx Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa
awk '{print $1 "\t" $2}' Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa.fai > genome.sizes

10. 指定酶切位点得到bacteria.bed文件

bin=/student2/software/hicpro/bin/HiC-Pro_3.1.0/bin/utils/digest_genome.py
$bin -r C^CATGG  -o  bacteria.bed Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa

11. 配置config-hicpro文件，复制到hictest项目文件夹下

12. conda 安装 aspera（用于快速下载数据）

ascp -v -QT -l 300m -P33001 -k1 -i /student2/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR824/SRR824846/SRR824846_1.fastq.gz ./

13. 最后运行（在hictest目录下）

HiC-Pro -i data -o out -c config-hicpro.txt

14. 结果

如有问题欢迎批评指正！

参考博客

HiC数据分析实战之Hic-pro-腾讯云开发者社区-腾讯云 (tencent.com)

参考基因组及注释下载 - 简书 (jianshu.com)
生信 | 三维基因组技术（三）：Hi-C 数据比对及HiC-Pro的使用 - 简书 (jianshu.com)