转录组分析需要安装linux么,转录组学习一(软件安装)

开篇:2017/10/7正式开始生信技能树论坛里的转录组入门从Linux下软件的安装 到 差异表达基因的功能注释及功能分析相关。

转录组相关软件的安装

任务

本地Windows电脑及服务器Linux系统下安装此次入门学习的各类软件及简单了解软件的基本用法:包括:sratoolkit, fastqc,Trimmomatic, hisat2, samtools, bcftools, htseq-count, R, Rstudio

windws下的一些基础编程工具如:git, notepad++, ...

环境变量

软件安装,首先最重要的问题就是Linux操作系统的环境变量。这问题真的是有些有些小坑,记得当时反复看了几篇文章+实际操作安装几次软件下才清楚了环境变量的概念。后来再在Windows的dos操作时就瞬间明白这种东西都是通用的概念。主要参考文章Linux学习-环境变量和可执行属性,群体基因组(二)

环境变量:首先要明白,Linux操作系统执行如ls/cd/mkdir这类的命令实际是系统从内置的文件目录下调用这些ls/cd/mkdir的程序文件然后执行。而这系统内置的文件目录就是环境变量。环境变量就是告诉电脑操作系统几个目录,这几个目录下存储着可执行的文件。

系统中环境变量的名字是PATH, 可通过echo

math?formula=PATH%20%E6%98%BE%E7%A4%BA%E7%B3%BB%E7%BB%9F%E7%8E%AF%E5%A2%83%E5%8F%98%E9%87%8F%E7%9A%84%E7%9B%AE%E5%BD%95%E3%80%82%20%E5%8A%A0%E5%85%A5**%E4%B8%B4%E6%97%B6%E5%8F%98%E9%87%8F**%20%E5%91%BD%E4%BB%A4%EF%BC%9Aexport%20PATH%3DPATH: ~~~~~~~~; 而加入永久变量可以通过将上述export命令加入到~/.bashrc文件里。如 echo 'PATH=$PATH:~/biosoft/samtools/bin' >> ~/.bashrc ,然后再source ~/.bashrc即可

sratoolkit

功能:sratookit主要功能现阶段主要还是把 NCBI的SRA数据库中的NGS原始测序数据 从sra格式转换到fastq格式,从而进行下一步的操作。 其他的还有prefetch 功能直接根据编号下载SRA数据

具体安装:

mkdir bio_soft && cd bio_soft

wget https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.8.2-1/sratoolkit.2.8.2-1-centos_linux64.tar.gz ### 选择不同系统下的版本,一般服务器的Linux版本为centos。

tar -zxvf sratoolkit.2.8.2-1-centos_linux64.tar.gz

echo ' PATH=$PATH:~/bio_soft/sratoolkit.2.8.2-1-centos_linux64.tar.gz/bin' >> ~/.bashrc ###添加到环境变量

source ~/.bashrc ##是环境变量生效

###以下为测试一下,和preftch -c

prefetch -v ##测试版本号

preftch -c SRR390728 ##速度有点慢,会默认下载到家目录的ncbi/public/sra文件夹下。

samtools

功能:处理SAM,BAM文件的工具软件合集。其中BAM是二进制的文件格式占用空间小,在高通量测序的数据处理中极为重要。

官方主页:主页

具体安装:

cd bio_soft

wget https://github.com/samtools/samtools/releases/download/1.6/samtools-1.6.tar.bz2

tar -jxvf samtools-1.6.tar.bz2

cd samtools-1.6

./configure ### 软件的编译过程。

make ###编译结束会发现samtools程序,把这个软件程序移到环境变量文件夹下及可以使用。

利用Conda来安装软件

ps. 自己装软件,真的是会遇到各种麻烦。软件编译啊,版本不对啊,软件安装得依赖于各种奇奇怪怪的前置包,有的软件就是死活装不上。装的时候就在想,如果Linux下有类似Windows的360软件管家这种东西该多好,直接一键安装,然后就能直接使用。也不必浪费时间在装软件这种事情上面了。结果后来看文章:还真的是有!这神器就是conda。

CONDA介绍:Conda是一种通用包管理系统,旨在构建和管理任何语言的任何类型的软件。通常与Anaconda和Miniconda一起分发。Anaconda囊括了100多个常用的Python包,一键式安装,解决Python包安装的痛苦。但后来发现,其还有更多的功能,尤其是其增加了bionconda频道后,生物信息分析的1500多个软件都可以一键安装了,免去了编译时间浪费和解决库文件安装的问题。简单来说,就是一键安装生物信息软件,还能日后更新,另外,还有一个重要的工作环境概念,可以简单的配置不同Python版本的环境、不同Python包的环境、不同R环境和R包的环境。

下载:下载Anaconda或者miniconda。miniconda是一个简化版本,保留了一些核心的功能,对于生信安装软件来说,miniconda已经足够,如果日后再出现什么问题,那就再重新装Anaconda再说吧

wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh ## 下载

安装:输入命令

bash Miniconda3-latest-Linux-x86_64.sh

然后就是一路回车加输入yes,最后有一个将miniconda目录输入到环境变量~/.bashrc中,输入yes,还未完成,最后输入命令 source ~/.bashrc 使环境变量文件生效,大功告成。

添加channels频道:重要的就是bioconda环境还有清华的镜像,里面包含几乎所有常用的生信软件。

conda config --add channels r

conda config --add channels defaults

conda config --add channels conda-forge

conda config --add channels bioconda

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda

conda install -c bioconda multiqc

软件搜索:看你要的生信软件是否有,以samtools为例

conda search samtools

软件安装:

conda install samtools

conda install samtools=(版本号)

其他目前常用的一些conda命令:

conda config --get channels ## 查看已添加的channels

conda config --remove channels ~~~ ##删除频道

conda update conda ## 更新conda软件

conda remove 软件名 ## 删除指定软件

conda update 软件名 ## 更新指定软件

conda list ## 查看已经安装软件

conda config --remove channels ~~~

source activate python=2.7

source deactivate

还有重要的创建不同软件的运行环境,可以运行不同软件的多个版本。具体操作参考Linux学习 - 又双叒叕一个软件安装方法

fastqc

功能:对测序结果进行可视化展示,二代测序数据质量分析软件

官方主页: 主页

安装:有了conda就很简单了

conda install fastqc

Trimmomatic

功能:对测序数据的raw reads进行剪切和过滤

conda install trimmomatic

hisat2

功能:将测序结果比对到基因组上,通常是对有参转录组进行的比对。HISAT2是TopHat2/Bowti2的继任者,使用改进的BWT算法,实现了更快的速度和更少的资源占用,作者推荐TopHat2/Bowti2和HISAT的用户转换到HISAT2。

其他相关网站:PloB 博客

conda install hisat2

### 基本命令

trimmomatic-0.35.jar PE -phred33 input_forward.fq.gz input_reverse.fq.gz output_forward_paired.fq.gz output_forward_unpaired.fq.gz output_reverse_paired.fq.gz output_reverse_unpaired.fq.gz ILLUMINACLIP:TruSeq3-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:36

HTseq

功能: 一款用于reads计数的软件,他能对位于基因组上的一些单位的reads数进行统计,这里所说的单位主要是指染色体上的一组位置区间(我们常见的就是gene exon

conda install htseq ##会有一些其他依赖的软件,默认安装就好

R及 R studio

对于目前还不是很懂的R语言来说,日后得熟悉基本语法,主攻R语言的画图功能。

R和R studio直接在Windows电脑上安装就好。其中基于R软件的一些转录组差异表达矩阵分析的包:如 ballgown, sleuth, ggplot2等等,需要安装Bioconductor,也是类似的一键安装生物信息软件的程序。

  • 1
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 1. 首先,您需要下载FastQC的安装文件。您可以从FastQC的官方网站上下载最新版本的安装文件。 2. 下载完成后,您需要解压缩安装文件。您可以使用以下命令来解压缩文件: tar -zxvf fastqc_v.11.9.zip 3. 进入FastQC的安装目录,并运行FastQC的安装脚本: cd FastQC chmod 755 fastqc ./fastqc 4. 如果您的系统缺少必要的依赖项,您需要安装这些依赖项。您可以使用以下命令来安装依赖项: sudo apt-get install default-jre 5. 安装完成后,您可以运行FastQC来检查您的数据质量。您可以使用以下命令来运行FastQC: ./fastqc your_data.fastq 6. 运行完成后,FastQC会生成一个HTML报告,您可以在浏览器中打开该报告来查看您的数据质量。 ### 回答2: FastQC是一个广泛使用的质量控制工具,可以对Illumina测序数据进行快速而准确的分析安装FastQC可以帮助研究人员评估测序数据的质量,提高实验的可靠性和相关分析的准确性。 在Linux安装FastQC需要遵循以下步骤: 1. 下载FastQC软件包 可以访问FastQC的官网(https://www.bioinformatics.babraham.ac.uk/projects/fastqc/)下载最新版本的FastQC软件包。将下载的程序包保存到一个你喜欢的位置,例如/home/user/soft/。 2. 解压缩FastQC软件包 使用Linux命令tar –xzvf fastqc_v0.11.8.zip -C /home/user/soft/将FastQC程序压缩包解压缩到刚才选择的目录。 3. 授权FastQC执行权限 使用chmod命令将FastQC程序授权为可执行文件: $ cd /home/user/soft/FastQC/ $ chmod 755 fastqc 4. 设置环境变量 为了能够在任何位置执行FastQC,需要将FastQC添加到PATH环境变量中。可以编辑.bashrc文件并将FastQC的路径添加到PATH变量中: $ cd ~ $ nano .bashrc export PATH=$PATH:/home/user/soft/FastQC 5. 安装Java环境 FastQC需要Java环境支持。如果你的计算机没有安装Java环境需要安装: $ sudo apt-get update $ sudo apt-get install default-jre 6. 测试FastQC 使用FastQC对测试数据进行分析,在Linux命令行中输入以下命令: $ fastqc /home/user/data/test.fastq.gz 如果一切都设置正确,将启动FastQC并生成质量控制报告。报告以HTML格式显示,可以使用任何Web浏览器查看。若要在命令行模式下解压缩FastQC报告,请运行以下命令: $ unzip /home/user/data/test_fastqc.zip 以上是在Linux安装FastQC的步骤。安装FastQC并使用它可以帮助科学家分析Illumina测序数据的质量,提高实验的可靠性和相关分析的准确性。 ### 回答3: FastQC是一款广泛使用的质量控制工具,可以对Illumina平台的测序数据进行质量分析。在Linux系统上安装FastQC需要按照以下步骤进行。 一、安装Java FastQC是基于Java开发的,所以要在Linux系统上运行FastQC,首先需要安装Java。可以使用以下命令安装OpenJDK: sudo apt-get update sudo apt-get install openjdk-8-jdk 安装完成后,可以使用以下命令检查Java是否正确安装: java -version 二、下载FastQC 从FastQC官方网站(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)下载FastQC源代码,或者在终端中使用以下命令下载: wget https://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.9.zip 三、解压缩FastQC 下载完成后,需要解压缩FastQC文件。可以在终端中使用以下命令: unzip fastqc_v0.11.9.zip 四、设置权限并运行FastQC 解压缩完成后,需要为FastQC脚本设置可执行权限。可以在终端中使用以下命令: chmod +x FastQC/fastqc 最后,可以使用以下命令运行FastQC: ./FastQC/fastqc [options] file1 file2 ... 其中,[options]是可选参数,file1,file2...是需要进行质量控制的测序文件。 总之,安装FastQC并不算难,但需要按照步骤进行操作。如果出现问题,可以参考FastQC官方网站提供的教程或者咨询专业人士的帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值