【bioinfo】酶切法片段化建库相比超声打断建库引入softclip使用FADE软件识别/去除

FADE是一款用于识别和移除酶切建库中产生双链伪影的工具。它分析BAM文件,注解并统计可能的错误软_clip,帮助提高DNA测序数据的准确性。软件可在Linux环境下运行,并提供了详细的统计输出,如sc_q_scores和art_status等,以判断softclip是否为artifact。
摘要由CSDN通过智能技术生成

FADE软件参考文献

参考文献:片段化酶诱导的双链伪影的表征和缓解 - PMC (nih.gov)

图1d是 文献软件识别和去除softclip流程图:
在这里插入图片描述

文献提供的酶切产生的错误识别和去除软件FADE软件git地址

文献补充材料图:由酶切产生的人工错误序列的碱基质量值偏高,相对其他softclip的质量值。

在这里插入图片描述

FADE软件下载

下载linux版FADE

wget https://github.com/blachlylab/fade/releases/download/v0.6.0/fade.many-linux-x86_64.tar.gz

软件使用

./fade annotate ${yourbam} > anno.bam   # 先增加bam注释
./fade stats anno.bam > stats.out  # 统计是否是artifact softclip(包含比对信息)
./fade stats-clip anno.bam > stats-clip.out  # 统计是否是artifact softclip(质量值和是否是artifact)

stats-clip.out结果文件示例:

qnamesc_q_scoressc_seqsc_avg_bqavg_bqart_status
A1:2:3:4F,FF,:F:F,FFFFFFFTCGGGCCGGTCGTCTTT31.444431.8671false
A1:2:3:5F,FF,:F:F,FFFF::F:FF:FTCGGGTTCGTGACCTCAGCGGC31.444431.8671ture

各列说明:

表头名说明
qnameread名称
sc_q_scoressoftclip序列质量值
sc_seqsoftclip序列
sc_avg_bqsoftclip序列质量值均值
avg_bq序列的质量值均值
art_statussoftclip是否是artifact [value: true/false]

示例统计softclip:

  • 去cigarstring为none
  • 去cigarstring长度为0
  • 保留cigarstring含S和M

更多了解:

酶切片段化建库,奇怪的知识增加了

酶切文库构建试剂盒 v2 升级款来袭

FFPE 样本的融合基因检测:DNA or RNA

超声法与酶切法随机打断基因组方法的比较

其他工具:

  • hairpin based artifacts: https://github.com/blachlylab/fade;
  • chimeric reads : https://github.com/broadinstitute/picard;
  • 保真性分析: https://nf-co.re/sarek (Sarek’s standard output for analysis of fidelity-based metrics)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值