在SharePoint 2010以及之前的版本里,爬网有两种类型,Full和Incremental。故名思议,Full Crawl 就是爬网的时候,把Content Source里面的内容都爬一遍。Incremental 则是在上次爬网基础之上,爬新增的内容。
这两种爬网存在一个问题:一旦启动Crawl,对于同一个Content Source,并行只能有一个crawl 在跑。如果想让最新的变动尽快的显示在搜索结果里,只能寄希望于Incremental crawl。如果Incremental crawl设置的间隔太大,或者一次incremental crawl运行时间很长,那么新增加内容需要很久才能显示在搜索结果里。
如果让新增内容尽快添加到index里,进而让用户搜索到呢?SharePoint 2013 增加了一种新的类型,叫Continues crawl。于Incremental crawl最大的不同是可以并行跑。因此任何新加的内容,都能被尽快加到index里。
新建后者编辑一个Content Source的时候,在Crawl Schedules里面可以选择Continuous Crawls还是Incremental Crawls。而且是只能选择其中一种情况。
注意:
(1) Continues crawl只对SharePointSite类型的Content source有效。
(2) Continues crawl 一旦开启,不能pause或者resume,只能disable/enable