一、全文检索简介
1.全文检索概念:
对非结构化数据(如文本数据),通过设置分词索引进行搜索。
2.特点:
(1)做了相关排序(如标题匹配排序靠前,内容包含靠后等)
(2)对搜索结果关键字高亮显示
(3)摘要提取
(4)更加精确(如因为通过分词技术搜索java则不会搜到javascript)
(5)只关注文本不关注语义
3.使用场景:
(1)替换模糊查询,提高查询效率
(2)对指定领域网站进行搜索
(3)输入法,搜索引擎等
4.核心:
(1)建立索引(建立句子分词关键字和索引的对应关系)
1.分词 2.语法处理 3.排序 4.去重
(2)搜索索引
通过‘关键字’分词然后去寻找对应索引,找到对应句子,组装成对象进行返回。