ubantu安装anaconda,再安装homer,并进行motif查找

#在安装好ubantu之后开始安装conda命令,关于anaconda和miniconda如何选择,可以参考关于bioconda,miniconda,conda,anaconda的区别 - 简书 (jianshu.com)icon-default.png?t=N7T8https://www.jianshu.com/p/0534043b4471,这里由于我的内存充足,因此直接安装anaconda#

#此步骤在网上有很多回答,我只是自己记录一下过程和遇到的问题,以方便后续自己参考#

1. 下载anaconda

进入anaconda官网进行下载Download Anaconda Distribution | Anacondaicon-default.png?t=N7T8https://www.anaconda.com/download,当然也可以使用国内镜像下载清华大学开源软件镜像站 | Tsinghua Open Source Mirroricon-default.png?t=N7T8https://mirrors.tuna.tsinghua.edu.cn/。我看从官网下载也挺快的,而且现在要吃个饭,所以就官网咯。

这里输入邮箱之后会给你提供下载连接,他会检测你的系统从而提供合适的下载版本,但是需要注意,我这里的系统是ubantu,并不是windows。

2. 安装anaconda

找到安装包,并在安装包目录下打开终端,用bash命令进行安装,根据提示进行安装即可,我这里是一路enter+yes过去的,安装目录也是用的默认路径。但是虚拟机在安装的时候可能出现环境激活失败的情况,导致conda命令无法使用,这个时候需要手动打开bashrc文件,并将conda的路径加进去,这个回答网上有很多。安装完成后重启终端,前端会出现base字样。

3. 添加镜像源

在安装程序包之前最好添加镜像源,不然下载时报错。我这里用的是从网上搜的中科大镜像源。安装完成后记得查看一下channels是否已添加。

已尝试可用:

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/

4. 安装homer

推荐从homer主页下载pl脚本来安装。

脚本下载:Homer Software and Data Download (ucsd.edu)icon-default.png?t=N7T8http://homer.ucsd.edu/homer/download.html

在主目录下创建一个homer的文件夹:mkdir homer

再将下载好的脚本复制到homer/文件夹中

并运行pl脚本进行安装:perl <脚本文件> -install homer

注:第一次安装时提示我缺少相关命令,gcc,g++,make,于是再sudo apt install <程序名>,将这三个命令安装好之后,再进行homer安装即可。在后续的过程中也会陆续遇到缺少程序包的情况,都可以用上述命令先安装再进行操作。

5. 从homer安装基因集

先查看可供使用的数据有哪些:perl 脚本 -list

从列出来的数据中挑选我们要使用的数据,这里我选择安装的是拟南芥的启动子序列和拟南芥基因组序列:perl 脚本 -install 数据名

6. 使用homer对本地启动子序列进行分析

6.1 激活homer

由于homer没有支持大豆的数据库,因此我看教程上说的直接用ID list进行检索的方式可能就不太行。但homer也提供了直接用序列进行检索的方式,但是这种方式需要提供一个background.fasta作为参考对象。细节参考官网文件Homer Software and Data Download (ucsd.edu)icon-default.png?t=N7T8http://homer.ucsd.edu/homer/motif/background.html。另外,官网提供了结果分析时的注意事项,很有必要提前阅读Homer Software and Data Download (ucsd.edu)icon-default.png?t=N7T8http://homer.ucsd.edu/homer/introduction/practicalTips.html

在尝试之前,首先确定背景序列的来源,一个是目标序列自身,另一个是对应基因组文件。目标序列的启动子文件倒是很好准备,但是对应基因组文件可能还需要再用tbtools提取一下。

首先来尝试用目标序列自身作为背景序列文件进行分析

根据主页的介绍,我拿了几个拟南芥的ID list进行尝试,但是出现报错

sh: 1: fasta2tab.pl: not found

!!! xxxx.fasta appears to be empty!?

后面发现还没有将环境变量加入进去,重新加入后,还是报错

仔细检查后是因为我直接复制了网上的参数,却忽略了我自己的homer路径不同于网上给的参考。

修改之后,直接运行脚本文件,不再报错。检查是否加入环境变量的方法是直接输入一个pl命令,但不加perl,如果弹出pl说明,则意味着正确,反之错误。

6.2 正式开始进行分析,以拟南芥的ID list为例子

此步骤只是为了检验homer有没有正确安装,因此随机选取了几个拟南芥基因进行分析。

根据findMotifs.pl的提示进行操作,len选用了6,8,10,12均会在后续报错说我的序列长度不对。但我想的是,我是用基因list进行的检索,怎么会出现长度不对的情况?因此怀疑是输入的ID较少导致的。因为我在txt的结果文档里面发现程序也匹配到了已知的motif。

至此,暂时认定homer安装正确,后续进行已知序列的motif分析。

========================================================================

续接6.2

输入拟南芥的ID list报错并不是因为输入序列过少导致,而是因为ID错误

  • 16
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值