目录
写在前面——本文是转录组上游分析的实战练习。主要包含四个步骤:
- 数据下载(包括sra数据、参考基因组、参考基因组注释文件)
- 质控过滤(使用trim-galore进行质控,使用fastqc、multiqc进行质量检测)
- 序列比对(hisat2)
- featureCounts定量
软件安装
详细步骤见
RNA-seq——一、Linux软件安装
安装配置conda
wget -c https://mirrors.bfsu.edu.cn/anaconda/miniconda/Miniconda3-latest-Linux-x86_64.sh
bash Miniconda3-latest-Linux-x86_64.sh
source ~/.bashrc
conda config --add channels r
conda config --add channels bioconda
conda config --add channels conda-forge
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.bfsu.edu.cn/anaconda/cloud/bioconda/
conda config --set show_channel_urls yes
使用conda安装软件
conda create -n rna python=3.8
conda activate rna
conda install fastqc
conda install multiqc
conda install trim-galore
conda install hisat2
conda install samtools
conda install subread
新建文件夹
00ref:存放参考基因组及注释文件
01raw_data:存放原始数据
02clean_data:存放清洗之后的数据
03align_data:存放比对后的文件
04matrix:存放reads计数文件
文件结构清晰,让人赏心悦目~
注:练习时注意当前所在位置,要在正确的文件夹中进行正确的操作。
一、下载数据
conda install sra-tools
conda update sra-tools
# -p Show progress
prefetch