16S样品拆分

Barcode是样品的标签,位于引物的外侧。比较典型的有三种,位于左端(正向引物上游),还有右端和双端两类也比较常用。

为什么16S测序有barcode?

目前扩增子研究对象细菌、真菌多样性没有表达基因数量大,一般是几百到千的水平,对数据量要求最多10万条序列即可饱合。将扩增子样本添加上barcode(标签),通常将48/60个样品混合在一起,构建一个测序文库,达到高通量测序大量样品同时降低实验成本的目的。

16S样品拆分的意思切开了barcode与扩增序列

方法一:使用Qiime 的split_libraries_fastq.py对样品根据barcode进行拆分

plit_libraries_fastq.py 
    -i reads.fastq \
    -b barcodes.fastq \
    -m mappingfile.txt \
    -o split/ \
    -q 20 \
    --max_bad_run_length 3 \
    --min_per_read_length_fraction 0.75 \
    --max_barcode_errors 0 \
    --barcode_type 6

方法二:使用Sabre 拆分数据

## Barcode data file format
# barcode_data.txt
barcode1 barcode1_output_file1.fastq barcode1_output_file2.fastq
barcode2 barcode2_output_file1.fastq barcode2_output_file2.fastq

## sabre pe 
sabre pe -m 2 -f input_file1.fastq -r input_file2.fastq -b barcode_data.txt \
-u unknown_barcode1.fastq -w unknown_barcode1.fastq

总结,算法应该是滑动窗口处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值