homer装载本地基因组,并进行Motifs查找

当我们研究的物种,homer不支持怎么办?通过本地上传基因组文件来解决。

前期准备:

1. 带检查的目标基因ID。

2. 非差异基因ID(用于背景文件)。

3. 目标基因组文件,fasta格式。

4. 目标基因组的注释文件。gff格式或gtf格式,这里推荐gtf格式,如果没有gff,可以用gffread进行转换。

5. 安装好homer等程序包。

1. 装载本地基因组文件

从数据库下载好基因组及其注释文件后,用gunzip命令解压,之后用loadGenome脚本进行装载,我们先输入脚本命令查看一下说明,这里看到gtf并不是必须的格式,gff同样可以使用,但推荐gtf,因此可以使用gffread将gff转换为gtf。

首先用apt命令安装gffread,再执行转换命令,如果不填输出文件路径,则默认当前文件夹

gffread -T <基因组文件.fasta> -o <输出的文件名.gtf>

得到gtf文件后,进行基因组装载,根据loadGenome必填项要求,示例代码如下:

loadGenome.pl -name <自己命名的基因组数据库名字> -fasta <下载好的基因组文件> -gtf <基因组注释文件> -org <null> -promoters <自己命名的启动子数据库名字> -version <根据版本号来定,可不填>

装载完基因组数据后,检查一下是否装载成功

perl configureHomer.pl -list

检查是否有自己命名的项目,有的话就意味着成功。

此时就可以通过基因的ID list进行motifs查找了,但在准备ID list前需要先去检查原始的gff文件,看看文件中对于基因ID是如何记录的,ID list一定要与之对应,背景文件的要求也一样。

建立存放数据的文件夹,之后执行下列命令

findMotifs.pl <目标序列ID.txt> <装载好的启动子数据库> <输出文件路径> -bg <背景文件.txt> -start -2000 -end 100 -mset plants -nogo -len 6,8,10,12,15

最终得到结果,即可进行后续分析。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值