9.4培训2

回顾

在上节课中我们知道了,在drop中有大磁珠,小磁珠和细胞。大磁珠上有很多DNA片段,他可以用来吸附小磁珠和细胞中的mRNA。在磁珠上最主要序列片段是barcode和UMI。其中barcode是用于检测测出来的基因是否来源于一个细胞,起到一个定性的作用;而UMI则是对基因的数量进行测行,起到一个定量的作用。(UMI可以用来去除PCR重复)

序列拆分

首先获取测序数据,文件是fastq的格式,而且存在fastq1、fastq2两个文件,他们分别是从3’和5’两个方向测序,可以起到一个提高测序准确度的作用。同时对于一些实验或者学科,我们则需要我们需要特别关注其中的一端的序列。接下来我们要对其中的内容进行拆分,以fastq1-cDNA数据为例,我们需要找出其barcode1、barcode2、UMI以及cDNA序列。然后通过PISA将其转化为fastq+的文件,同样的对于Oligo的fastq文件也需要将其进行拆分后转变为fastq+文件。

数据筛选

Barcode筛选:去除非白名单的barcode、如果是单个的测序错误且测序质量较低则校正。用star进行mapping去除一些质量不好的reads,将测序出的不存在于选定基因库上的基因去除。随后对于测序中关于UMI的一些问题进行处理例如去除全是重复序列的UMI、去除bp小于10的UMI、对于不同基因序列但拥有同样的UMI进行校正。生成SAM文件然后用PISA生成BAM文件(在数据处理时用fastq文件但在NCBI中有上传BAM文件,这里需要用bamtofastq包将其转变成fastq文件再做分析)再用GTF对基因进行注释。以及去除barcode捕获量不高的bead。(可能原因:一些细胞在进入液滴前就细胞破裂导致其中基因量下降)

数据汇总

对Oligo的测序序列进行对比,测定大磁珠是否来自于同一drop,将来自于同一drop的基因进行整合,然后质控即去除线粒体DNA最后聚类分析找寻marker。

问题

Fastq1和fastq2两个文件的结果是单纯的完全相反的吗,还是说还有其他别的不同?

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值