FADE软件参考文献
参考文献:片段化酶诱导的双链伪影的表征和缓解 - PMC (nih.gov)
图1d是 文献软件识别和去除softclip流程图:
文献提供的酶切产生的错误识别和去除软件FADE
:软件git地址
文献补充材料图:由酶切产生的人工错误序列的碱基质量值偏高,相对其他softclip的质量值。
FADE软件下载
下载linux版FADE
wget https://github.com/blachlylab/fade/releases/download/v0.6.0/fade.many-linux-x86_64.tar.gz
软件使用
./fade annotate ${yourbam} > anno.bam # 先增加bam注释
./fade stats anno.bam > stats.out # 统计是否是artifact softclip(包含比对信息)
./fade stats-clip anno.bam > stats-clip.out # 统计是否是artifact softclip(质量值和是否是artifact)
stats-clip.out
结果文件示例:
qname | sc_q_scores | sc_seq | sc_avg_bq | avg_bq | art_status |
---|---|---|---|---|---|
A1:2:3:4 | F,FF,:F:F,FFFFFFF | TCGGGCCGGTCGTCTTT | 31.4444 | 31.8671 | false |
A1:2:3:5 | F,FF,:F:F,FFFF::F:FF:F | TCGGGTTCGTGACCTCAGCGGC | 31.4444 | 31.8671 | ture |
各列说明:
表头名 | 说明 |
---|---|
qname | read名称 |
sc_q_scores | softclip序列质量值 |
sc_seq | softclip序列 |
sc_avg_bq | softclip序列质量值均值 |
avg_bq | 序列的质量值均值 |
art_status | softclip是否是artifact [value: true/false] |
示例统计softclip:
- 去cigarstring为none
- 去cigarstring长度为0
- 保留cigarstring含S和M
更多了解:
其他工具:
- hairpin based artifacts: https://github.com/blachlylab/fade;
- chimeric reads : https://github.com/broadinstitute/picard;
- 保真性分析: https://nf-co.re/sarek (Sarek’s standard output for analysis of fidelity-based metrics)