介绍全文检索概念

数据分类:

结构化数据

行数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,能够用数据或统一的结构加以表示
数字、符号

非结构化数据

无法用数字或统一的结构表示
文本、图像、声音、网页
结构化数据属于非结构化数据
非结构化数据即为全文数据

全文数据的检索

相关概念

一种将文件中或者数据库中所有文本与检索项匹配的文字资料检索方法。
对全文数据的检索。

两种方法

顺序扫描法:
索引扫描法:全文检索的基本思路,也就是将非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目的。

全文检索的过程:

索引创建:字典。索引只创建一次

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

索引搜索:

1.用户输入查询语句
2.对查询语句进行词法分析,语法分析,及语言处理
3.搜索索引,得到符合文档

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值