一:什么是全文检索
1、数据分类
(1)、结构化数据:类型固定、格式固定、有限长度。最常见的就是数据库的数据
(2)、非结构化数据:类型不固定、格式不固定、长度不固定。例如:磁盘上的文件
2、对结构化数据的查询
使用sql语句查询。查询简单,速度快
3、非结构化数据查询
把非结构化数据变成结构化数据:先对文档的内容进行字符串拆分,得到单词列表,基于单词列表创建一个索引。查询时直接在索引上进行查询找到单词,根据单词和文档对 应关系找到对应的文档,这个过程就叫做全文检索。
二:如何实现全文检索
1、使用luncen实现全文检索
Luncen是一个基于java开发的全文检索工具包
三:全文检索的应用领域
1、做搜索引擎:百度、谷歌、360搜索、搜狗等
2、站内搜索:微博搜索、论坛搜索
3、电商搜索:京东、淘宝