最近做电信项目需要做一个全文索引以减少查询时间,我们该项目的一个表一天产生的数据为15G左右,需要对大概3个月的数据进行处理,目录结构为信息日期+唯一目录号。
小弟不才只能在18秒只能索引64G数据,做了一下测试,发现时间主要是花费在new indexSearch上,其实索引只花费了3秒左右的时间,剩下的十几秒都花在了new indexsearch上,也曾想过把已经创建好的indexsearch放到map中存储起来,但由于存储的数据量过大,在查询不久后就会报内存溢出的异常。
对性能优化个人理解是在数据量不是太大的情况下最好是建到一个文件中,这样以后在查询的时候只需new 一个indexsearch就能查到数据,并且在创建了之后就不用在new了