基于如上复杂的系统架构,尤其是4)模式,我们在测试当中也碰到相当多棘手的技术问题 1) 海量数据是否都按预期的分词算法建立索引了呢? 2) 机器分词的效果与手工分词相差有多大呢? 3) 海量查询的返回结果是否多查了 4) 海量查询的返回结果是否漏查了 5) 海量查询的返回结果的加亮、标注如期加了? 6) 海量查询的返回结果中相关性分数计算是否正确? 7) 海量查询的返回结果积分计算是否正确了呢 8) 海量查询的返回结果积分相同时,排序的先后依据唯一么? 9) 加入即时更新模块后,每次查询结果都不同,新建的索引内容是否都反馈到查询结果里面了呢? 10) 海量数据时CACHE是否预期CACHE该cache的内容? 11) 海量数据时CACHE是否依照一定的过时算法令cache的内容失效呢? 12) 应用程序在32位LINUX操作系统和64位的LINUX的索引、查询结果是否依然一样? 13) 应用程序在不同的OS上索引、查询结果是否依然一样?