![a862305b-d910-eb11-8da9-e4434bdf6706.png](http://p02.5ceimg.com/content/a862305b-d910-eb11-8da9-e4434bdf6706.png)
转录组是指细胞在某一功能状态下转录出来的所有RNA的总和。转录组测序(Transcriptome sequencing)是基于Illumina HiSeq测序平台检测细胞内所有mRNA的一项技术,能够快速获得细胞在某一状态下所有的转录本信息,因而被广泛应用于基础研究、药物研发和临床诊断等多个领域。
在获得原始测序数据(FASTQ文件格式)后,该如何就FASTQ测序文件进行后续分析处理呢?下面,让我们一起来学习吧!
前期准备:
硬件:
Linux系统,>4G运行内存
软件:
Miniconda、FastQC、Cutadapt、Hisat2、SAMtools、subread(FeatureCounts)
PART1 测序数据质量评估采用FastQC软件进行分析
FastQC(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)是一款基于Java的软件。无论是Windows/Linux系统运行FastQC,首先都必须安装java(注意Java的版本不能超过1.6,否则FastQC会无法运行)。其作用是对测序数据进行质量评估。
FastQC安装:
$ cd path/to/fastqc
$ chmod 755 fastqc
$ ./fastqc
$ sudo ln -s /path/to/FastQC/fastqc /usr/local/bin/fastqc
运行格式:
$ fastqc -o outdir -t threads fastq1 fastq2 ...
主要参数:
-o --outdir FastQC 所生成的报告文件的储存路径
-t --threads 程序运行的线程数
示例:
$ fastqc -o FASTQC/ -t 8 Ctrl-1_combined_R1.fastq.gz Ctrl-1_combined_R2.fastq.gz Ctrl-2_combi