ubantu安装anaconda，再安装homer，并进行motif查找

DTLINK

已于 2024-06-17 21:39:46 修改

阅读量972

点赞数 16

文章标签： python 开发语言

于 2024-06-14 13:11:12 首次发布

本文链接：https://blog.csdn.net/qq_41708938/article/details/139621845

版权

#在安装好ubantu之后开始安装conda命令，关于anaconda和miniconda如何选择，可以参考关于bioconda,miniconda,conda,anaconda的区别 - 简书 (jianshu.com)https://www.jianshu.com/p/0534043b4471，这里由于我的内存充足，因此直接安装anaconda#

#此步骤在网上有很多回答，我只是自己记录一下过程和遇到的问题，以方便后续自己参考#

1. 下载anaconda

进入anaconda官网进行下载Download Anaconda Distribution | Anacondahttps://www.anaconda.com/download，当然也可以使用国内镜像下载清华大学开源软件镜像站 | Tsinghua Open Source Mirrorhttps://mirrors.tuna.tsinghua.edu.cn/。我看从官网下载也挺快的，而且现在要吃个饭，所以就官网咯。

这里输入邮箱之后会给你提供下载连接，他会检测你的系统从而提供合适的下载版本，但是需要注意，我这里的系统是ubantu，并不是windows。

2. 安装anaconda

找到安装包，并在安装包目录下打开终端，用bash命令进行安装，根据提示进行安装即可，我这里是一路enter+yes过去的，安装目录也是用的默认路径。但是虚拟机在安装的时候可能出现环境激活失败的情况，导致conda命令无法使用，这个时候需要手动打开bashrc文件，并将conda的路径加进去，这个回答网上有很多。安装完成后重启终端，前端会出现base字样。

3. 添加镜像源

在安装程序包之前最好添加镜像源，不然下载时报错。我这里用的是从网上搜的中科大镜像源。安装完成后记得查看一下channels是否已添加。

已尝试可用：

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

4. 安装homer

推荐从homer主页下载pl脚本来安装。

脚本下载：Homer Software and Data Download (ucsd.edu)http://homer.ucsd.edu/homer/download.html

在主目录下创建一个homer的文件夹：mkdir homer

再将下载好的脚本复制到homer/文件夹中

并运行pl脚本进行安装：perl <脚本文件> -install homer

注：第一次安装时提示我缺少相关命令，gcc，g++，make，于是再sudo apt install <程序名>，将这三个命令安装好之后，再进行homer安装即可。在后续的过程中也会陆续遇到缺少程序包的情况，都可以用上述命令先安装再进行操作。

5. 从homer安装基因集

先查看可供使用的数据有哪些：perl 脚本 -list

从列出来的数据中挑选我们要使用的数据，这里我选择安装的是拟南芥的启动子序列和拟南芥基因组序列：perl 脚本 -install 数据名。

6. 使用homer对本地启动子序列进行分析

6.1 激活homer

由于homer没有支持大豆的数据库，因此我看教程上说的直接用ID list进行检索的方式可能就不太行。但homer也提供了直接用序列进行检索的方式，但是这种方式需要提供一个background.fasta作为参考对象。细节参考官网文件Homer Software and Data Download (ucsd.edu)http://homer.ucsd.edu/homer/motif/background.html。另外，官网提供了结果分析时的注意事项，很有必要提前阅读Homer Software and Data Download (ucsd.edu)http://homer.ucsd.edu/homer/introduction/practicalTips.html。

在尝试之前，首先确定背景序列的来源，一个是目标序列自身，另一个是对应基因组文件。目标序列的启动子文件倒是很好准备，但是对应基因组文件可能还需要再用tbtools提取一下。

首先来尝试用目标序列自身作为背景序列文件进行分析

根据主页的介绍，我拿了几个拟南芥的ID list进行尝试，但是出现报错

sh: 1: fasta2tab.pl: not found

!!! xxxx.fasta appears to be empty!?

后面发现还没有将环境变量加入进去，重新加入后，还是报错

仔细检查后是因为我直接复制了网上的参数，却忽略了我自己的homer路径不同于网上给的参考。

修改之后，直接运行脚本文件，不再报错。检查是否加入环境变量的方法是直接输入一个pl命令，但不加perl，如果弹出pl说明，则意味着正确，反之错误。

6.2 正式开始进行分析，以拟南芥的ID list为例子

此步骤只是为了检验homer有没有正确安装，因此随机选取了几个拟南芥基因进行分析。

根据findMotifs.pl的提示进行操作，len选用了6，8，10，12均会在后续报错说我的序列长度不对。但我想的是，我是用基因list进行的检索，怎么会出现长度不对的情况？因此怀疑是输入的ID较少导致的。因为我在txt的结果文档里面发现程序也匹配到了已知的motif。

至此，暂时认定homer安装正确，后续进行已知序列的motif分析。

========================================================================

续接6.2

输入拟南芥的ID list报错并不是因为输入序列过少导致，而是因为ID错误

DTLINK

关注

16
点赞
踩
15

收藏

觉得还不错? 一键收藏
0
评论
ubantu安装anaconda，再安装homer，并进行motif查找

找到安装包，并在安装包目录下打开终端，用bash命令进行安装，根据提示进行安装即可，我这里是一路enter+yes过去的，安装目录也是用的默认路径。注：第一次安装时提示我缺少相关命令，gcc，g++，make，于是再sudo apt install ，将这三个命令安装好之后，再进行homer安装即可。这里输入邮箱之后会给你提供下载连接，他会检测你的系统从而提供合适的下载版本，但是需要注意，我这里的系统是ubantu，并不是windows。我看从官网下载也挺快的，而且现在要吃个饭，所以就官网咯。
复制链接

扫一扫