linux系统下使用psi_blast生成位置特异性打分矩阵(PSSM)

作为一个新手,初次使用PSSM矩阵,感觉无从下手,经过一番研究,终于得到了生成PSSM矩阵的方法,为了给更多像我这样的小白一点思路,特写下我做PSSM矩阵的一些方法,希望能给大家一些帮助,也欢迎大家进行批评指正。

1.下载ncbi-blast,下载地址为:ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATEST/,选择适合自己电脑的版本(windows/macos/linux),利用xftp将其传入服务器【我用的是xshell和xftp,Xshell可以在Windows界面下用来访问远端不同系统下的服务器,xftp用以传输文件】

2.将下载的blast进行解压,解压指令为:tar -xzvf  ncbi-blast-2.7.1+x64-linux.tar.gz(下载的blast的压缩文件,在linux系统上可以使用tab键打全) 解压完后,可以ls一下,查看是否解压成功,解压完成后,使用cd  ncbi-blast-2.7.1+,再ls可查看一下ncbi-blast-2.7.1里面的内容。

3.再去下载所需要的数据库(nr库)

用到的是蛋白质序列,下载nr库即可,下载地址:ftp://ftp.ncbi.nlm.nih.gov/blast/db/   ,nr库比较大,用迅雷批量下载。还可以暂时使用swissprot库代替一下。

4.下载完后,将下载的文件进行批量解压,使用指令:ls *.tar.gz | xargs -n1 tar xzvf

5.将下载的数据库进行格式化数据,用到makeblastdb:/home/xzsang/ncbi-blast-2.7.1+/bin/makeblastdb -in /home/xzsang/ncbi-blast-2.7.1+/db/sp/uniprot_sprot.fasta -dbtype prot -title sp -out /home/xzsang/ncbi-blast-2.7.1+/db/sp/sp -parse_seqids

6.简单的代码输出矩阵(这样是输出单条序列的pssm矩阵):/home/xzsang/ncbi-blast-2.7.1+/bin/psiblast -query /home/xzsang/query.fasta  -db /home/xzsang/ncbi-blast-2.7.1+/db/sp/sp -num_iterations 3  -out 1 -out_ascii_pssm 1.pssm

7.批量输出PSSM矩阵:可使用pycharm编写的python 程序,程序如下:

#!/usr/bin/python
# -*- coding:utf-8 -*-
import os
totalSize = 0
fileNum = 0
dirNum = 0
def visitDir(path):
    global totalSize
    global fileNum
    global dirNum
    for lists in os.listdir(path):
        sub_path = os.path.join(path, lists)
        if os.path.isfile(sub_path):
            fileNum = fileNum+1                      # 统计文件数量
            totalSize = totalSize+os.path.getsize(sub_path)  # 文件总大小
        elif os.path.isdir(sub_path):
            dirNum = dirNum+1                       
            visitDir(sub_path)                          
visitDir("/home/xzsang/binder/")
print(fileNum)
for i in range(1,fileNum+1):
    os.system("/home/xzsang/ncbi-blast-2.7.1+/bin/psiblast -query /home/xzsang/binder/split_"+ str(i)+".fasta"+" -db /home/xzsang/ncbi-blast-2.7.1+/db/sp/sp -num_iterations 3"+" -out_ascii_pssm "+str(i)+".pssm")
将该程序放到服务器上,在操作系统上执行该程序即可,运行出来的结果就是批量生成的PSSM矩阵(可分开两部分做,DNA结合蛋白批量生成PSSM矩阵,非结合的批量生成PSSM矩阵,将生成的矩阵分别放在两个文件夹下面,便于日后处理数据使用)
  • 0
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
Linux系统下安装和使用BLAST(Basic Local Alignment Search Tool)可以按照以下步骤进行: 1. 安装依赖项:首先,确保您的系统已经安装了必要的依赖项,包括gcc编译器、make工具和zlib库。您可以使用包管理器(如apt、yum或dnf)来安装这些依赖项。例如,在Ubuntu系统上,可以使用以下命令进行安装: ```shell sudo apt update sudo apt install build-essential zlib1g-dev ``` 2. 下载BLAST软件包:访问NCBI BLAST官方网站(https://blast.ncbi.nlm.nih.gov/Blast.cgi)并下载适用于Linux系统BLAST软件包。您可以选择下载预编译的二进制文件或源代码。 3. 解压缩文件:如果您下载的是预编译的二进制文件,解压缩下载的文件。如果您下载的是源代码,则需要解压缩并进入解压后的目录。 4. 配置和编译:打开终端,进入解压后的BLAST目录,并运行以下命令来配置和编译BLAST: ```shell ./configure make ``` 5. 安装:运行以下命令以root权限安装BLAST: ```shell sudo make install ``` 6. 设置环境变量:为了能够在终端中随时使用BLAST命令,您需要将BLAST可执行文件所在的路径添系统的PATH环境变量中。您可以编辑~/.bashrc文件并在其中添以下行(假设您安装的是blast+软件包): ```shell export PATH="/path/to/blast+/bin:$PATH" ``` 替换"/path/to/blast+"为您实际安装的BLAST软件包的路径。 7. 验证安装:重启动终端或运行`source ~/.bashrc`使环境变量生效。然后,尝试运行以下命令来验证BLAST是否成功安装: ```shell blastn -version ``` 如果成功安装,将显示BLAST软件的版本信息。 现在您已经成功安装了BLAST。您可以使用各种BLAST命令(如blastn、blastp等)来执行不同类型的序列比对和搜索操作。请参考BLAST官方文档以了解更多关于使用BLAST的详细信息和示例。
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值