- 博客(1)
- 资源 (1)
- 问答 (3)
- 收藏
- 关注
转载 倒排索引——搜索引擎原理
这是一篇copy 的文章就不标原创了 1)基本概念 文档 泛指一切以文本形式存在的存储对象,包括html、xml、word、pdf等等。 文档集合 多个文档组成的集合。 文档编号 在搜索引擎内部,为文档集合中的每个文档赋予的内部唯一编号,并以此作为唯一标识。 单词编号 在搜索引擎内部,为单词赋予的唯一表征。 倒排索引 一种单词-文档矩阵的具体实现形式,通过倒排索引,可以根据单词快速地定位包含单词的...
2019-08-09 13:48:18 469
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人