1.根据bin的上游与下游的互作情况计算出
bin(i)
的
binsignal(i)
,公式如下:
conf.frep
表示两个bin之间的互作频率;
2.找拐点:根据每个bin的
binsignal
用分段函数拟合出所有bin的主要趋势,函数表达式为
Fj=Lj−Ej
,其中
Lj
是线的长度,
Ej
是拟合的残差;因此这就可以看出不是长度越长越好,要还要考虑残差的影响;从起点开始出发后,当我们发现有比当前更好的点,就更新线;当没有时,就保留当前的线。
3.找局部最小点:然后我们需要找到局部最小点,它们通常有两个特征:1)先下降后上升;2)相邻两个拐点间区域最小;
4.假定
bini
,我们定义其上游区域内的互作和下游区域内的互作为
′within.interactions′
的互作,上游与下游之间的互作为
′between.interactions′
,我们用秩和检验检验两者得到P-value;
5.再通过计算每两个bin之间的互作频率,然后根据在这个遗传距离上的所有互作频率算出标准化的值;
6.筛选出带有P-value<0.05的局部最小值点就是TD的边界点,然后划分出TD。
文献:
Shin H, Yi S, Chao D, et al. TopDom: an efficient and deterministic
method for identifying topological domains in genomes[J]. Nucleic
Acids Research, 2015, 44(7):e70-e70.]
(https://academic.oup.com/nar/article/44/7/e70/2467818/TopDom-an-efficient-and-deterministic-method-for)
软件网址(http://zhoulab.usc.edu/TopDom/)