KeyarchOS系统下本地blast+安装与使用教程

目录

1 概述

2 安装准备

2.1 操作系统环境

2.2 blast版本

3 下载

4 安装

4.1 安装并配置环境

4.2 验证是否安装成功

5 使用

5.1 下载并解压人基因组序列文件

5.2 下载人TP53基因序列

5.3 创建数据库

5.4 序列对比


1 概述

浪潮信息KOS是浪潮信息基于Linux Kernel、OpenAnolis等开源技术自主研发的一款服务器操作系统,支持x86、ARM等主流架构处理器,性能和稳定性居于行业领先地位,具备成熟的 CentOS 迁移和替换能力,可满足云计算、大数据、分布式存储、人工智能、边缘计算等应用场景需求。详细介绍见官网链接浪潮信息云峦服务器操作系统KeyarchOS-浪潮信息

BLAST(Basic Local Alignment Search Tool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速将核苷酸或蛋白质序列与公开数据库进行相似性序列比较,并计算匹配的统计显著性。进而可用于推断序列之间的功能和进化关系,并帮助识别基因家族成员。如果您想进一步了解BLAST算法,您可以参考NCBI的BLAST Course,该页有BLAST算法的介绍。找到序列之间的局部相似区域。该程序与序列数据库进行比较,详情请看官网链接BLAST: Basic Local Alignment Search Tool

2 安装准备

2.1 操作系统环境

版本信息:KeyarchOS 5.8

硬件平台:X86_64

2.2 blast版本

ncbi-blast-2.9.0+-x86-linux

3 下载

进入网址:Index of /blast/executables/blast+

选择合适的版本下载,这里我选择的是2.9.0+的x86架构,linux环境的压缩包

4 安装

4.1 安装并配置环境

在linux上创建文件夹,例如/home下创建soft文件夹,并将下载的压缩包放到文件夹下解压,命令如:tar -zxvf ncbi-blast-2.9.0+-x64-linux.tar.gz

进入解压的文件夹下的bin目录,输入pwd,查看当前路径,复制路径

添加环境变量,使用 vim ~/.bashrc 命令,编辑文件,在最后一行添加:export PATH=刚刚复制的路径:$PATH ,然后点击esc,输入:wq!保存文件并退出。 

使用source ~/.bashrc 命令让其生效 

4.2 验证是否安装成功

输入blastn -version 命令,出现版本号则安装成功,若出错可能由于环境配置错误或blast依赖包未安装,可根据具体错误信息使用yum install 进行安装。

5 使用

 在使用之前需要准备一个fasta库,也就是所有的序列信息,还有要比对的源数据,也是一个fasta文件,这里以人基因组序列文件与人TP53基因序列将进行序列对比实例演示。

5.1 下载并解压人基因组序列文件

以GRCh38为例,下载路径为https://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_44/gencode.v44.transcripts.fa.gz

5.2 下载人TP53基因序列

>TP53
CTCAAAAGTCTAGAGCCACCGTCCAGGGAGCAGGTAGCTGCTGGGCTCCGGGGACACTTTGCGTTCGGGC
TGGGAGCGTGCTTTCCACGACGGTGACACGCTTCCCTGGATTGGGTAAGCTCCTGACTGAACTTGATGAG
TCCTCTCTGAGTCACGGGCTCTCGGCTCCGTGTATTTTCAGCTCGGGAAAATCGCTGGGGCTGGGGGTGG
GGCAGTGGGGACTTAGCGAGTTTGGGGGTGAGTGGGATGGAAGCTTGGCTAGAGGGATCATCATAGGAGT
TGCATTGTTGGGAGACCTGGGTGTAGATGATGGGGATGTTAGGACCATCCGAACTCAAAGTTGAACGCCT
AGGCAGAGGAGTGGAGCTTTGGGGAACCTTGAGCCGGCCTAAAGCGTACTTCTTTGCACATCCACCCGGT
GCTGGGCGTAGGGAATCCCTGAAATAAAAGATGCACAAAGCATTGAGGTCTGAGACTTTTGGATCTCGAA

以上是人TP53基因的部分序列,复制以上文本并保存到TP53.fa文件中。 

5.3 创建数据库

linux 解压的文件夹下创建database文件夹,将下载的gencode.v44.transcripts.fa.gz文件放在database文件夹下,并使用gunzip gencode.v44.transcripts.fa.gz解压压缩包

将TP53.fa也放在database文件夹下 

进入database目录下,执行建库命令:

makeblastdb  -in gencode.v44.transcripts.fa -dbtype nucl -title "GRCh38" -out GRCh38

主要参数说明:

-in:待格式化的序列文件(即gencode.v44.transcripts.fa文件)

-dbtype:数据库类型,prot(蛋白质序列)或nucl(核酸序列)

-title:为数据库指定一个标题。

-out:数据库名

更多参数说明请执行:makeblastdb -help

5.4 序列对比

进入database目录下,执行命令:blastn -query TP53.fa -db "GRCh38" -out TP53-blastn.txt

主要参数说明:

blastn:使用的比对程序(此处为核酸序列和核酸序列的比对)

-query:表示自己想要比对的FASTA格式的核酸序列

-db:是所建立的比对数据库

-out:输出文件路径及文件名(此处为TP53-blastn.txt)

查看结果 cat TP53-blastn.txt 

  • 21
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Linux系统安装和使用BLAST(Basic Local Alignment Search Tool)可以按照以下步骤进行: 1. 安装依赖项:首先,确保您的系统已经安装了必要的依赖项,包括gcc编译器、make工具和zlib库。您可以使用包管理器(如apt、yum或dnf)来安装这些依赖项。例如,在Ubuntu系统上,可以使用以下命令进行安装: ```shell sudo apt update sudo apt install build-essential zlib1g-dev ``` 2. 下载BLAST软件包:访问NCBI BLAST官方网站(https://blast.ncbi.nlm.nih.gov/Blast.cgi)并下载适用于Linux系统BLAST软件包。您可以选择下载预编译的二进制文件或源代码。 3. 解压缩文件:如果您下载的是预编译的二进制文件,解压缩下载的文件。如果您下载的是源代码,则需要解压缩并进入解压后的目录。 4. 配置和编译:打开终端,进入解压后的BLAST目录,并运行以下命令来配置和编译BLAST: ```shell ./configure make ``` 5. 安装:运行以下命令以root权限安装BLAST: ```shell sudo make install ``` 6. 设置环境变量:为了能够在终端中随时使用BLAST命令,您需要将BLAST可执行文件所在的路径添加到系统的PATH环境变量中。您可以编辑~/.bashrc文件并在其中添加以下行(假设您安装的是blast+软件包): ```shell export PATH="/path/to/blast+/bin:$PATH" ``` 替换"/path/to/blast+"为您实际安装BLAST软件包的路径。 7. 验证安装:重新启动终端或运行`source ~/.bashrc`使环境变量生效。然后,尝试运行以下命令来验证BLAST是否成功安装: ```shell blastn -version ``` 如果成功安装,将显示BLAST软件的版本信息。 现在您已经成功安装BLAST。您可以使用各种BLAST命令(如blastn、blastp等)来执行不同类型的序列比对和搜索操作。请参考BLAST官方文档以了解更多关于使用BLAST的详细信息和示例。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值