1。这是最简单的一种布署方式,通常用于简单测试。
2.当过索引大小超过一台机器时,应该使用cluster方式。
see also:
nutch 分布式搜索-cluster-hdfs index
3。虽然2中解决了数据量大的问题,但没解决快速搜索的目的。
see also:
nutch 分布式搜索-cluster-hdfs index
4.在3的基础上进一步进行优化。当然 个人认为这是最高效的搜索方式,当然了,这种方式可能带来的问题是维护比较困难。但我认为这是可以解决的。
see also:
nutch 分布式搜索-cluster-local index
** 是的,以上所有方式均可以利用load balance方式加以实现,为了简单这里没有画出。