linux分析测序数据,16S测序分析系列(一)菌属丰度表获取

本文详细介绍了如何从Miseq 16S amplicon V3V4测序数据中,通过Linux环境和QIIME2软件流程,提取并处理菌属丰度表,包括质检、切引物、数据导入、DADA2处理、分类学注释和数据标准化等步骤。
摘要由CSDN通过智能技术生成

Miseq 16S amplicon V3V4 PE300测序是目前菌群结构谱研究最为常用的测序手段。本文将以此类测序的下机数据为例展示“如何从Miseq测序数据中快速提取出可以用来统计分析的菌属相对丰度表”的工作流程。该丰度表是做菌群研究最为基本的数据,要想发文章还必须做大量的统计分析。在以后的文章中我们会继续推出一些统计分析方法,敬请期待!

软件准备

Linux环境:

1.       FastQC

质检下机数据

2.       Cutadapt

切除测序引物

3.       QIIME2

序列拼接、质控、比对、注释

软件版本:QIIME2 2018.4或QIIME2 2018.8

Windows环境:

1.       Filezilla

下载Linux环境中的数据或上传数据到Linux环境

2.       Excel

数据处理

3.  QIIME2 view

查看QIIME2输出的以.qzv为后缀的文件

数据准备

1.  Miseq 16S amplicon V3V4测序下机数据

*R1.fastq,*R2.fastq

2.  测序引物

p1 -> CCTACGGGNGGCWGCAG

p2 -> GACTACHVGGGTATCTAATCC

3.  表型文件metadata.txt

准备存放样本信息的表型文件,以tab键为分隔符。可以先在Excel中做表,然后保存为tsv文件。

格式如下:

c9f7aae182847113f75432dfcf2cc6bf.png

4.  Greengenes细菌16S全长序列数据库

下载得到gg_13_8_otus.tar.gz(最新版,大小为305M)后将其解压得到99_otus.fasta(序列)和99_otu_taxonomy.txt(分类)两个文件,文件获取如下:

5af1d6994fb4638556607ed1b14ef5fc.png

流程概览

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值