Finding Enriched Motifs in Genomic Regions (findMotifsGenome.pl)
在指定区域做motif enrichment,大大降低了假阳性。
MEME也可以做,但是设定更加复杂。
转录因子的表达具有高度的组织特异性,而且已知的TF只有1000多个,基因有30000多个,所以一个TF的靶基因可能有几百个,而且具有高度的时空组织特异性。
实验的方法就不说了,可靠、成本高、耗费劳力。
以下只说高通量数据的预测方法。
最简单的预测就是基于基因表达,co-expressed就是可能的靶基因,预测软件一大把。
问题很多,首先理解假设:
1. TF的线性变化引起target gene的线性变化,他们线性相关;
2. TF的调控是sparse的,
问题:
1. 有人说这根本就不是线性的,TF的yes or no,决定target gene的表达;
2. 不是线性相关,存在shift,先后的shift是普遍存在的;
3. co-expression是无法得出target关系的;
所以,现在大家都开始结合motif enrichment了,TF的靶向作用是靠motif与基因组DNA结合来