whole-genome-sequencing Data Analysis 学习笔记2 软件安装

1.测序数据大小计算公式:

人类基因组(30亿个碱基)X 30(测序深度)=900亿个碱基(1800亿个字母)
900亿个碱基/150(测序策略PE150)=6亿条reads
6亿条reads X 45(每条reads的名字长度)=2070亿个字母(每个字母一个字节)
2070亿个字母 / 每个G所包含的字节数 (1024*1024*1024)=192.7838G

注释:
测序仪器下机数据的 fastq 文件中, 每条序列都对应了相同长度的质量值, 反映出每个碱基的准确性和可靠性, (现在主流用的) 计算公式为:
Q = -10log10p
而这个 p 值就是 Phred 计算出来的, 表示一个碱基被识别错误的可能性, Phred 一开始是一个软件 (或者说计算方法), 对测序仪器识别到的荧光强度 (三代的不了解) 进行评估, 针对不同仪器有不同的标准表, 然后根据表中荧光强度的范围和分辨率分析得出碱基的 p 值, Q 值为 10 就表示这个碱基有 90% 的概率是正确的, 20 就是 99%, 40 就是 4 个 9

2.查看计算资源
查看memory

free -g

反正我自己台式机很小,都是个位数,和Jimmy的没法比。。
查看core

cat /proc/cpuinfo |grep process |wc

查看storage

df -h

保证至少要有8core+16G+1T
我的台式机:3+3+14G。。不管了,先装软件

3.给笨兔兔装各种生信软件
优先挑选二进制可执行软件
创建并切换到新建文件夹biosoft
在biosoft 文件夹下创建cmake文件夹并切换,然后下载cmake

#注意这些代码是用来测试的,不要用
mkdir biosoft
cd ~/biosoft
cd ~/biosoft
mkdir cmake &&  cd cmake
wget http://cmake.org/files/v3.3/cmake-3.3.2.tar.gz

又出现:正在解析主机 wget (wget)… 失败:域名解析暂时失败。
问题描述:无法解析下载网址
问题原因:DNS配置不正确
问题解决:通过命令 gedit /etc/resolv.conf 打开DNS配置文件,在文件中加入

 nameserver 8.8.8.8
 nameserver 8.8.4.4

保存退出,好了 开始正常下载

下载完成后继续安装

重新来,以下面的代码为准,因为要创建Bin,方便以后卸载

mkdir -p  ~/biosoft/myBin
echo 'export PATH=/home/mary/biosoft/myBin/bin:$PATH' >>~/.bashrc
source ~/.bashrc
cd ~/biosoft
mkdir cmake &&  cd cmake
wget http://cmake.org/files/v3.3/cmake-3.3.2.tar.gz
tar xvfz cmake-3.3.2.tar.gz
cd cmake-3.3.2
./configure --prefix=/home/mary/biosoft/myBin
make
make install
#echo命令的功能是在显示器上显示一段文字,一般起到一个提示的作用。

Linux ./configure –prefix命令
以后便于卸载

## Download and install bowtie
cd ~/biosoft
mkdir bowtie &&  cd bowtie
wget https://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.2.9/bowtie2-2.2.9-linux-x86_64.zip
unzip bowtie2-2.2.9-linux-x86_64.zip
## Download and install BWA
mkdir -p  ~/biosoft/myBin
echo 'export PATH=/home/mary/biosoft/myBin/bin:$PATH' >>~/.bashrc
source ~/.bashrc
cd ~/biosoft
mkdir bwa &&  cd bwa
wget https://sourceforge.net/projects/bio-bwa/files/bwa-0.7.15.tar.bz2
tar xvfj bwa-0.7.15.tar.bz2 
cd bwa-0.7.15
./configure --prefix=/home/mary/biosoft/myBin
make
make install

**注意上面又出现了make无法执行的问题,尝试

sudo apt-get install zlib1g-dev

问题解决
不过最后是用系统提示语句安装的。。

sudo apt install bwa
sudo apt install bowtie
sudo apt install bowtie

上面这三个软件都是这样直接装的,顶多新建了目录,反正是系统自己提示的,目前还不知为什么

然后装samtools

## Download and install samtools
## http://samtools.sourceforge.net/
## http://www.htslib.org/doc/samtools.html
cd ~/biosoft
mkdir samtools &&  cd samtools
wget https://github.com/samtools/samtools/releases/download/1.3.1/samtools-1.3.1.tar.bz2
tar xvfj samtools-1.3.1.tar.bz2
cd samtools-1.3.1
./configure --prefix=/home/mary/biosoft/myBin
make
make install
~/biosoft/myBin/bin/samtools --help

又提示找不到文件
那退出来到根目录,看看samtools安好了没,结果系统提示:

sudo apt install samtools

那。。安吧。好了

接下来安picardtools

## Download and install picardtools
## https://sourceforge.net/projects/picard/
## https://github.com/broadinstitute/picard
cd ~/biosoft
mkdir picardtools &&  cd picardtools
wget http://ncu.dl.sourceforge.net/project/picard/picard-tools/1.119/picard-tools-1.119.zip
unzip picard-tools-1.119.zip

去问系统,有picard tools 么,系统说没有,

sudo apt install picard-tools

所以又按系统说的安了,其实还是没安好。。待解决
千万别按成picard了,那是另一个软件,好像是个播放器。。

然后安freebayes

## Download and install freebayes
## https://github.com/ekg/freebayes
## http://clavius.bc.edu/~erik/CSHL-advanced-sequencing/freebayes-tutorial.html
cd ~/biosoft
mkdir freebayes &&  cd freebayes
## wget -O freebayes-master.zip  https://codeload.github.com/ekg/freebayes/zip/master
## unzip freebayes-master.zip
wget http://clavius.bc.edu/~erik/freebayes/freebayes-5d5b8ac0.tar.gz
tar xzvf freebayes-5d5b8ac0.tar.gz
cd freebayes
make
~/biosoft/freebayes/freebayes/bin/freebayes

系统未找到命令恩,先这样吧

然后安varscan

cd ~/biosoft
## https://sourceforge.net/projects/varscan/files/
## http://varscan.sourceforge.net/index.html
mkdir VarScan  &&  cd VarScan
wget https://sourceforge.net/projects/varscan/files/VarScan.v2.3.9.jar

看不出来像安好的。

cd ~/biosoft
mkdir SnpEff &&  cd SnpEff
##  http://snpeff.sourceforge.net/
##  http://snpeff.sourceforge.net/SnpSift.html
##  http://snpeff.sourceforge.net/SnpEff_manual.html
wget http://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip
## java -jar snpEff.jar download GRCh37.75
## java -Xmx4G -jar snpEff.jar -i vcf -o vcf GRCh37.75 example.vcf > example_snpeff.vcf
unzip snpEff_latest_core.zip
## https://github.com/najoshi/sickle
cd ~/biosoft
mkdir sickle && cd sickle
wget https://codeload.github.com/najoshi/sickle/zip/master -O sickle.zip
unzip sickle.zip
cd sickle-master
make
~/biosoft/sickle/sickle-master/sickle -h

这种-h查看的都是安装好了的

cd ~/biosoft
## http://www.usadellab.org/cms/?page=trimmomatic
## http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/TrimmomaticManual_V0.32.pdf
mkdir Trimmomatic && cd Trimmomatic
wget http://www.usadellab.org/cms/uploads/supplementary/Trimmomatic/Trimmomatic-0.36.zip
unzip Trimmomatic-0.36.zip
java -jar ~/biosoft/Trimmomatic/Trimmomatic-0.36/trimmomatic-0.36.jar -h

Linux下安装软件的一般步骤

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值