Homer -- Hypergeometric Optimization of Motif EnRichment 配置及基本使用

  • Homer 安装
    # Homer 安装模块,之前需要配置 Perl 环境
    & wget http://homer.salk.edu/homer/configureHomer.pl
    # 安装 Homer 基本模块
    & perl configureHomer.pl -install
     
    # 当你需要安装或者删除package
    & perl configureHomer.pl -install package_name
    & perl configureHomer.pl -remove paceage_name
    
    # 如果你需要下载 Homer支持的物种参考基因组
    #Human (hg17, hg18, hg19), Mouse (mm8, mm9, mm10), Rat (rn4, rn5), Frog (xenTro2, xenTro3), Zebrafish (danRer7), Drosophila (dm3), C elegans (ce6, ce10), S. cerevisiae (sacCer2, sacCer3), pombe (ASM294v1), Arabidopsis (tair10), Rice (msu6)
    & perl configureHomer.pl -install Organisms_name
    
    #建议网速不错的同学,直接 
    & perl configureHomer.pl -all
    
    #其他参数直接 perl configureHomer.pl 查看
    
    # 最后一定记得吧 homer/bin 加入环境变量,才能直接调用模块名
  • Homer 基本使用
    # 如果是MACS找到的peaks 文件,需要提取对应的列(前三列)给Homer作为输入文件
    & awk '{print $4"\t"$1"\t"$2"\t"$3"\t+"}' sample_peaks.bed >sample_homer.bed
    
    
    & findMotifsGenome.pl pake_file ref_fastq output_dir additional_option
    
    # 如果关注的物种未被Homers支持,可以使用自己的参考基因组文件
    & findMotifsGenome.pl peaks_file ref_fastq output_dir


  • findMotifsGenome.pl 基本参数解释
    # 基本选项
    -mask 区分重复小写序列,可以添加到基因组之后,如 mm9r
    
    -bg 背景基因组位置 默认自动,用来删除与目标位置重叠的背景位置
    
    -chopify 将大的背景区域切割为目标区域的大小
    
    -len <#>[,<#>,<#>...] motif长度,默认8,10,12,值大于12可能会导致内存不足,从而减少序列分析数量或是分析短的序列区域
    
    -size <#> 用于 motif 发现的片段大小,默认200
    
    -size <#,#> -size -100,50 即获得中心-100到+50的序列
    
    -size give 使用确定的给定区域
    
    -S <#> 要优化的motif数量, 默认25
    
    -mis <#> 全局优化,搜索#个不匹配的字符串,默认2
    
    -norevopp 不搜索motif的反响链
    
    -nomotif 不搜索de novo motif 富集
    
    -rna 输出RNA motif logos 并且与RNA motif database 数据库自动比较,自动设置-norevopp


  • 1
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值