生信小白学习日记Day6——NGS分析流程（before bwa）

最新推荐文章于 2023-04-26 23:51:55 发布

weixin_42953727

最新推荐文章于 2023-04-26 23:51:55 发布

阅读量1k

点赞数

分类专栏： NGS基础文章标签： NGS分析流程 before bwa

本文链接：https://blog.csdn.net/weixin_42953727/article/details/90731036

版权

本文介绍了在NGS数据分析前，如何使用CreateSequenceDictionary和samtools faidx创建序列字典及FAI索引文件。通过这两个工具，可以为FASTA格式的参考序列建立必要的元数据，以便后续的分析工具使用。同时，文章讲解了如何利用sed、xargs等工具处理fq.gz文件，进行文件路径操作。

摘要由CSDN通过智能技术生成

2019年6月1日，祝大家节日快乐，抖音上有个视频，采访10后熊孩子：你认为90后现在多大了？熊孩子：umm, 40-50岁吧；“你认为他们还应该过儿童节吗？”“不应该，因为他们已经是老人了。”==！

上一篇文章中用bwa mem算法进行序列比对时, 用到了一些上一步产生的 ${lane_id}、$ {sample}的这些变量，那么这篇就来尝试解读一下bwa比对之前批量读取原始.fq文件的过程。

脚本如下：

java -jar /**/picard-tools-1.124/picard.jar CreateSequenceDictionary R=ref.fasta O=ref.dict
/**/samtools faidx ref.fasta
/**/bwa-0.7.12/bwa index -a bwtsw ref.fasta

find /**/00.rawdata -name "*_1.fq.gz" | sed 's/_1.fq.gz$//' | \
    xargs -n 1 -P 3 -I PREFIX \
    sh -c '
        sample=`dirname PREFIX`
        lane_id=`

最低0.47元/天解锁文章

weixin_42953727

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
生信小白学习日记Day6——NGS分析流程（before bwa）

2019年6月1日，祝大家节日快乐，抖音上有个视频，采访10后熊孩子：你认为90后现在多大了？熊孩子：umm, 40-50岁吧；“你认为他们还应该过儿童节吗？”“不应该，因为他们已经是老人了。”==！上一篇文章中用bwa mem算法进行序列比对时, 用到了一些上一步产生的laneid、{lane_id}、laneid、{sample}的这些变量，那么这篇就来尝试解读一下bwa比对之前批量读取原...
复制链接

扫一扫