扩增子流程·测序文件的批量改名

测序文件的批量改名

公司返回的测序文件多为下图所示,可我们不需要那么长的文件名,我们只需要其中的一部分或者重新命名为我们想要的。
图1
将测序文件名改成这样
在这里插入图片描述
我们只需使用如下命令即可完成!

#首先进入到你存放测序文件的文件夹中
cd seq
#将所有.fa.gz文件名写入到一个.txt文件中,并命名为metadata.txt。
ls *.fq.gz > metadata.txt

Excel编辑列表,第二行为最终命名方式

打开metadata.txt文件,Ctrl + A全选后,复制到一个新的Excel表格中。如下图所示:

在这里插入图片描述
在这里插入图片描述

使用Excel表格中的数据-分列功能将其分离。具体步骤:Excel–数据—分列–分隔符号

在这里插入图片描述
在这里插入图片描述

结果如图

在这里插入图片描述

制作我们想要的名字,将第一列复制给第二列,同样使用数据-分列–分隔符号–其他【_】–完成。此时,将第二列再复制一遍,并保存到第三列(保护列)。

在这里插入图片描述
将其另存为为.txt格式,并放到seq文件夹目录下。

# 转换行尾换行符
sed -i 's/\r//' metadata.txt
# 检查手动命名列2是否唯一
cut -f 2 metadata.txt|wc -l
cut -f 2 metadata.txt|sort|uniq|wc -l
# 如果第二次结果是第一次的一办,则命名非冗余
# 可选移动mv,复制cp,硬链ln,或软链ln -s
# 此处使用复制cp
awk '{system("cp "$1"_R1.fq.gz "$2"_R1.fq.gz")}' metadata.txt
awk '{system("cp "$1"_R2.fq.gz "$2"_R2.fq.gz")}' metadata.txt

最终结果如图

在这里插入图片描述

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
16s扩增子多样性测序平台是一种用于研究微生物群落多样性的技术。它通过放大16s rRNA基因的特定片段,并对其进行测序,从而可以鉴定出样本中存在的不同微生物种类和丰度。 在选择16s扩增子多样性测序平台时,我们需要考虑以下几个因素: 1. 扩增子选择:不同的16s扩增子可以放大不同的区域,因此选择合适的扩增子可以影响到测序结果的准确性和可靠性。一般来说,常用的扩增子包括V1-V3、V3-V4和V4-V5等。 2. 测序平台:目前常用的测序平台包括Illumina MiSeq、Ion Torrent PGM和454 pyrosequencing等。每种平台的测序深度和准确性都有所不同,因此在选择测序平台时需要考虑所需的数据量以及实验预算。 针对测序数据量的选择,我们需要结合实际需要和预算考虑: 1. 数据需求:根据研究目的和问题的复杂程度,选择适当的数据量可以满足需求。如果只是对样本的一般微生物群落进行初步了解,较小的数据量可能足够。而对于复杂的微生物样本,更大的数据量可以提供更详细的分析信息。 2. 预算限制:不同的测序平台和数据量对应的测序费用也是考虑的重要因素。通常来说,测序费用会随着数据量的增加而增加。因此,我们需要根据实验预算来选择适当的数据量。 总结来说,选择16s扩增子多样性测序平台时需要考虑扩增子的选择以及测序平台的性能;选择测序数据量时需要根据实际需求和实验预算进行权衡。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值