1.lucene存储结构
关键字 | 文章号【出现频率】 | 出现位置 |
guangzhou | 1【2】 | 2,6 |
hadoop | 1【3】,3【5】 | 1,5,8 1,2,5,9,10 |
part | 2【2】,7【1】 | 12,54 11 |
room | 2【1】,2【2】 | 13 15,47 |
1.关键字按照字符排序,使用二分法定位
2.lucene将以上结构分为三个文件;字典文件,词频文件,位置文件
字典文件存储着指向词频文件与位置文件的指针
1.lucene存储结构
关键字 | 文章号【出现频率】 | 出现位置 |
guangzhou | 1【2】 | 2,6 |
hadoop | 1【3】,3【5】 | 1,5,8 1,2,5,9,10 |
part | 2【2】,7【1】 | 12,54 11 |
room | 2【1】,2【2】 | 13 15,47 |
1.关键字按照字符排序,使用二分法定位
2.lucene将以上结构分为三个文件;字典文件,词频文件,位置文件
字典文件存储着指向词频文件与位置文件的指针