摘要
最近开始接手16S项目,遇到一个原始问题,就是制作样本的统计文档和metadata文件。微生物动辄几十上百个样品,一个一个整理是不现实的。目前在手动制作metadata文件时用到几个excel的参数,在此记录一下。
数据准备
上图展示了部分样品信息,这两列分别是样品名和细分分类标签,其中细分分类标签又有三个含义。BBH19 = BB(样品位置)+ H (个体状态,这里是健康) + 19 (采集年份)。客户提出要求,除了进行细分分类分析,还要按照样品位置和个体状态进行分组分析。接下来我们使用excel里的函数来提取分类字符串。
提取字符串
按照前面说的,我们按照样品位置、状态以及采集年份分类,需要提取前2个,中间1个以及最后2个字符。
LEFT(B2,2) #第一行是title,第一列是样品名,因此选择B2,后面参数2是代表提取从左往右数前2个字符串。
=MID(B2,3,1) #MID()代表提取中间的字符串,
#B2:提取字符串单元格
#3:从左往右第三个字符串开始
#1:提取后面的字符串个数
RIGHT(B2,2) #从右往左数前2个字符串。
结果展示
总结
sample文档和metadata文档都是在使用qiime2的过程中需要用到的,并且根据不同的项目,需要在metadata中提供不同的实验设计,方面后续分析中能够分组分析。欢迎大家加群讨论。