全文检索
结构化数据
行数据, 存储在数据库里, 可以用二维表结构来逻辑表达实现的数据
能够用数据或统一的结构加以表示
数字.符号.枚举
非结构化数据
无法用数字或统一的结构表示
文本,图像,声音,网页
结构化数据属于非结构化数据
非结构化数据即为全文数据
两种方法
顺序扫描法
索引扫描法
全文检索的基本思路, 也即将非结构化数据中的一部分信息提取出来, 重新组织, 将其变得有一定结构, 然后对此有一定结构的数据进行搜索, 从而达到相对较快的目的
全文检索过程
创建索引
索引保存了什么?
字典(索引对应id)
如何创建索引