基因组组装hifiasm(三代 PacBio Hifi)-step2

文章讲述了基于K-mer分析的杂合率判断,当杂合率等于或大于0.6%时进行分型。使用hifiasm工具处理数据,生成未分型和部分分型的contig文件,分别通过awk命令从gfa格式文件中提取contig信息,形成haplotype1和haplotype2的序列数据。
摘要由CSDN通过智能技术生成

根据K-mer分析

杂合率<0.6%,不需要分型

杂合率>或=0.6%,需要分型

A 得到 未分型 的数据

/media/aa/DATA/JJH/software/hifiasm/hifiasm --primary -o assembly -t 10 /media/aa/DATA/SZQ2/bj/my/genome/5.1210/01cleandata/m64164_221227_152233.hifi_reads.bam.fasta.gz 2> assembly.log

 提取contig

awk '/^S/{print ">"$2;print $3}' /media/aa/DATA/SZQ2/bj/my/genome/5.1210/02hifiasm_primary/assembly.p_ctg.gfa > assembly.p_ctg.fa

B 得到 分型 的数据

/media/aa/DATA/JJH/software/hifiasm/hifiasm -o assembly -t 10 /media/aa/DATA/SZQ2/bj/my/genome/5.1210/01cleandata/m64164_221227_152233.hifi_reads.bam.fasta.gz 2> assembly.log

得到

prefix.bp.hap1.p_ctg.gfa: haplotype1的部分分型的contig graph
prefix.bp.hap2.p_ctg.gfa: haplotype2的部分分型的contig graph

提取contig

# hap1
$ awk '/^S/{print ">"$2;print $3}' /media/aa/DATA/SZQ2/bj/my/genome/5.1210/02hifiasm/assembly.bp.hap1.p_ctg.gfa > assembly.hap1.p_ctg.fa
# hap1
$ awk '/^S/{print ">"$2;print $3}' /media/aa/DATA/SZQ2/bj/my/genome/5.1210/02hifiasm/assembly.bp.hap2.p_ctg.gfa > assembly.hap2.p_ctg.fa

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值