illumina的barcode居然有那么多类型

最新推荐文章于 2020-07-14 20:53:05 发布

weixin_34168880

最新推荐文章于 2020-07-14 20:53:05 发布

阅读量592

点赞数

原文链接：https://yq.aliyun.com/articles/650540

版权

前段时间第一次拿到200多个群体的测序数据，准备对这些数据分析，然后就遇到自己以前分析几个样本不会遇到的问题：illumina平台一次上机会得到好几个T的数据，公司是如何保证不会把数据给错用户呢？

其实答案我也知道，就是给不同样本加上barcode，但是我没想到的是barcode居然有那么多组合方式。

barcode虽然可以简单分为两种，如下

inline barcode: 出现在一条read的碱基序列中
index barcode: 出现在一条read的ID部分

但是在reads中出现的花样就特别多了，可以只在一端read中出现Inline barcode（图一），或在一端read中出现index barcode（图二），也可以在一端read中同时有inline barcode和index barcode（图三），也可以在一端有inline barcode 加 index barcode，在另一端只有 index barcode（图四），以及在两端都只有index barcode（图五）, 最后是在两端都有 inline barcode（图六）

图一：SE|PE single inline barcode

图二：SE|PE single index barcode

图三：SE inline barcode + index barcode

图四：PE inline barcode + index barcode

图五：PE index barcode

图六：PE inline barcode

虽然有那么多加barcode的策略，但其实本质上是两种标记策略。当然还有一种策略就是你承包一条lane，这样子你就不需要加barcode，也就是图A。

图B中的Barcode就是inline code，它在接头的5'端即测序引物那部分上，和DNA片段邻近，在测序的时候，加入引物，然后一边合成一边测序，于是在最后的序列中就会引入barcode。

图C的Index是index barcode，在接头的3'端，测序的时候也是先加第一个引物(SP1)，然后一边合成一边测序，等读完之后，再加入index引物(IP)去测index的部分，对样本进行区分，因此不会占用读长。

barcode

Rd: read，短读
SP: sequencing primers，测序引物

如果样本比较小，也就是十几个，公司会用index barcode，得到的read长度都是100或150。如果样本有上百个，公司就考虑用inline barcode，如果返回的是分开样本的fastq，那么长度就不到150，100，因为去掉了inline barcode。

最后强烈推荐观看这个视频陈巍学基因1：Illumina测序化学原理

weixin_34168880

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。