摘要
前段时间研究16S/ITS的分析,对qiime2的分析流程有了一定了解,分析方面已经有一套流程了,后续会进行整理发布。在分析之前,软件需要提供预处理文件,包括一份样品数据表格(双端测序数据格式),一份样品分组表格。这两个之前都是手动生成,分组表格是没什么办法的,每个项目的分组情况都不一样,但是样品数据表格是可以研究一下自动生成的。在此记录一下。
工具与方法
使用语言:bash
使用命令
第一部分是从供应商拿到的项目数据里面提取原始数据。放到01.data中备用
for i in */00.RawData/*/*.raw_1.fq.gz;
do
i=${i%.raw_1.fq.gz};
mv {${i}.raw_1.fq.gz,${i}.raw_2.fq.gz} ./;
done
接下来就需要通过样品名获取完整的样品数据路径,并且打印qiime2需要的表格格式。
echo -e "id\tforward-absolute-filepath\treverse-absolute-filepath" >> all_sample.txt;
for i in *.raw_1.fq.gz;
do
i=${i%.raw_1.fq.gz};
echo -e "${i}\t`pwd`/${i}.raw_1.fq.gz\t`pwd`/${i}.raw_2.fq.gz" >> all_sample.txt;
done
命令介绍
echo -e “” : 识别并打印双引号里面的分隔符,这样确保输出格式正确;
pwd
:在echo内执行路径获取命令,补充样品的绝对路径;
">> " :覆盖输入到文档中,如果是单个大于号输入,将清除先前文档,最后文档中只有最后一行。
结果展示
总结
其实文档本来手动操作也不难,用excel也能做。但考虑到qiime2要求绝对路径,每次修改都有些麻烦,因此优化了这部分内容。如果大家有更好的建议,欢迎加群讨论,或者加我VX:bbplayer2021邀请进群。