超超超完整hicpro安装和使用教程

上一篇博文记录了hicpro在服务器的安装教程,各种依赖都是手动安装,这篇换了一种方法实现,原理都是一样的。

这篇文章从头到尾亲自实现并成功。

先确保安装好anaconda

1. 下载并解压安装包(/student2/software)

wget -c http://github.com/nservant/HiC-Pro/archive/refs/tags/v3.1.0.tar.gz
tar -zxvf HiC-Pro-3.1.0.tar.gz

2. 创建虚拟环境

conda env create -f /student2/software/HiC-Pro-3.1.0/environment.yml -n nehic

3. 进入HiC-Pro-3.1.0配置config-install.txt

vi config-install.txt

4. 执行make configure命令

此时多了一个config-system.txt

5. 查看这个文件

6. 执行make命令安装成功

 7. 配置环境变量(退出虚拟环境)

vi ~/.bashrc

 任意路径下输入HiC-Pro,都会输出使用信息

8. 下载参考基因组

wget ftp://ftp.ensemblgenomes.org/pub/bacteria/release-40/fasta/bacteria_20_collection/caulobacter_crescentus_na1000/dna/Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa.gz
gunzip Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa.gz
bowtie2-build  Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa   bacteria

 9. 获取genome.sizes文件

samtools faidx Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa
awk '{print $1 "\t" $2}' Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa.fai > genome.sizes

 10. 指定酶切位点得到bacteria.bed文件

bin=/student2/software/hicpro/bin/HiC-Pro_3.1.0/bin/utils/digest_genome.py
$bin -r C^CATGG  -o  bacteria.bed Caulobacter_crescentus_na1000.ASM2200v1.dna.toplevel.fa

11. 配置config-hicpro文件,复制到hictest项目文件夹下

 12. conda 安装 aspera(用于快速下载数据)

ascp -v -QT -l 300m -P33001 -k1 -i /student2/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR824/SRR824846/SRR824846_1.fastq.gz ./

13. 最后运行(在hictest目录下)

HiC-Pro -i data -o out -c config-hicpro.txt

14. 结果

如有问题欢迎批评指正! 

参考博客

HiC数据分析实战之Hic-pro-腾讯云开发者社区-腾讯云 (tencent.com)

参考基因组及注释下载 - 简书 (jianshu.com)
生信 | 三维基因组技术(三):Hi-C 数据比对及HiC-Pro的使用 - 简书 (jianshu.com)
 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值