对于Lucene.NET的使用,我也是刚入门不久,就是在做项目的时候要用到全文检索的功能,具体的项目要求是能按照每个对象的类型不同将不同类型的对象存储在不同的文件夹中。如下图所示:
上图中的每个文件夹代表的是每种类型。对于实际的项目来说们一般是通过Remote的方式调用的服务端的方法,但是这就需要将在服务端获取到的数据通过网络协议传送到客户端,而如果数据量很大的话,在序列化的时候就会出现内存溢出的错误。因此要采取分批将数据传到客户端,分批创建索引,我们可以每次传50万条记录到客户端,这样就可以做到分页创建索引的目的了。
在创建索引的时候有时会有频繁的IO操作,而这样会消耗大量的内存,为了节省服务器的内存,我们要尽量的避免频繁的IO操作,具体的解决方案如下:设计Dictionary<string,List<T>>做为整个索引方法的数据源,其中键指的是数据对象的类型,键值指的是每个类型对应的所有的数据。这样的话只要初始化有限个IndexWriter就可以了,就可以避免频繁的IO操作。为了加快创建索引的效率,我们可以利用部分内存,将内存的缓存设置的大一些,Lucene的默认值是10,我们可以设置为100。