ES--001--初体验

最新推荐文章于 2024-03-15 00:04:22 发布

敲木鱼的小和尚

最新推荐文章于 2024-03-15 00:04:22 发布

阅读量252

点赞数

分类专栏： --- 4. ElasticSearch

本文链接：https://blog.csdn.net/qq_26389415/article/details/100943484

版权

5 篇文章 0 订阅

订阅专栏

Paas平台？
- Saas 平台购买一个软件服务。定制一款符合自己公司软件，很难
- PaaS 平台即服务（比如，数据存储服务，文件存储服务，对象存储）---- 可以定制模块化服务
面临问题：
- 数据检索数据量在 10亿到 100亿
  - 数据如何存储
  - 如何降低成本
  - 检索效率

数据分为两类
- 结构化数据：值具有固定格式或有限长度的数据，如数据库，元数据等
- 非结构化数据：值不定长或无固定格式的数据，如互联网数据，邮件，Word文档。也称全文数据。
全文检索：把非结构化数据转换为有规律的结构化数据，从数据中获取数据的过程
索引：从非结构化数据中提取出的然后重新组织的信息。
全文数据的两种搜索方式
- 顺序扫描法：顺序扫描每个文档内容，看看是否有要搜索的关键字，实现查找文档的功能，根据文档找词。
- 反向索引法：提前将搜索的关键字建立索引，然后再根据索引查找文档，也就是根据词找文档。

区别
- 当单纯的对已有数据进行搜索时，Solr更快
- 当实时建立索引时，Solr会产生io阻塞，查询性能较差，ES具有明显的优势。
- 随着数据量的增加，Solr的搜索效率会变的更低，而ES没有明显的变化。
总结
- 安装都简单
- Solr利用ZK进行分布式管理，而ES自身带有分布式协调管理功能
- Solr支持更多格式的数据，而ES仅支持json文件格式
- Solr官方提供的功能更多，而ES本身更注重于核心功能，高级功能多有第三方插件提供
- Solr在传统的搜索应用中表现好于ES，但在处理实时搜索应用时效率明显低于ES。

在这里插入图片描述

全文检索的流程分为两大流程，索引创建，搜索索引
- 索引创建：将现实世界中所有的结构化数据和非结构化数据提取信息，创建索引的过程
- 搜索索引：就是得到用户的查询请求，搜索创建的索引，然后返回结果的过程。

索引：通过关键词，检查出整个内容，那么关键字就称为索引。即从非结构化数据中提取出的然后重新组织的信息，成为索引，比如字典，字典的拼音表和部首表就相当于字典的索引，对每个字的解释都是非结构化的，如果字典没有音节表和部首表，在辞海中找一个字只能顺序扫描。

在这里插入图片描述

在这里插入图片描述

关注