搜索:
即通过用户输入的关键字找到相关的有序的信息列表
索引:
正向索引:
文件ID | 内容所切分的关键词 |
ID1 | 关键词1、关键词2、关键词3 |
ID2 | 关键词3、关键词5、关键词6 |
反向索引
关键词 | ID |
关键词1 | ID1、ID2 |
关键词2 | ID3、ID4 |
搜索引擎中使用的是倒排索引。
倒排索引中不仅仅记录了包含响应关键词文件的ID,还会记录关键词频率、每个关键词出现在文件中的位置等信息。在排名过程中,这些信息会被分别进行加权处理,并应用到最终的排名结果中。
即通过用户输入的关键字找到相关的有序的信息列表
正向索引:
文件ID | 内容所切分的关键词 |
ID1 | 关键词1、关键词2、关键词3 |
ID2 | 关键词3、关键词5、关键词6 |
反向索引
关键词 | ID |
关键词1 | ID1、ID2 |
关键词2 | ID3、ID4 |
搜索引擎中使用的是倒排索引。
倒排索引中不仅仅记录了包含响应关键词文件的ID,还会记录关键词频率、每个关键词出现在文件中的位置等信息。在排名过程中,这些信息会被分别进行加权处理,并应用到最终的排名结果中。