问题描述:
对简易搜索引擎的查询关键字建立缓存,将所有查询词都保存下来,并记录词频,当超过存储容量时,会根据词频替换掉词频小的查询词。数据量大,要用到磁盘存储。
初步思路:
对查询词进行分类,对每个类别的查询词进行排序,得到top-k个放入内存缓存。
分类:用hash,不过要自己重写hashcode函数
是否要用到归并排序?
索引?
如何存储?
对简易搜索引擎的查询关键字建立缓存,将所有查询词都保存下来,并记录词频,当超过存储容量时,会根据词频替换掉词频小的查询词。数据量大,要用到磁盘存储。
初步思路:
对查询词进行分类,对每个类别的查询词进行排序,得到top-k个放入内存缓存。
分类:用hash,不过要自己重写hashcode函数
是否要用到归并排序?
索引?
如何存储?