官方解释
Elasticsearch 是一个分布式、RESTful 风格的搜索和数据分析引擎,能够解决不断涌现出的各种用例。作为 Elastic Stack 的核心,Elasticsearch 会集中存储您的数据,让您飞快完成搜索,微调相关性,进行强大的分析,并轻松缩放规模。
首先介绍一下什么是结构化数据和非结构化数据以及正排索引和倒排索引:
结构化:指具有固定格式,固定长度的数据,如数据库中的字段。
非结构化:指格式和长度不固定的数据,如电商网站的商品详情
索引:将数据中的一部分信息提取出来,重新组织成一定的数据结构,我们可以根据该结构进行快速搜索,这样的结构称之为索引。
正排索引:以Id建立索引,通过Id快速查找数据。如数据库中以主键建立正排索引。
倒排索引:非结构化数据中,我们通常将关键词作为索引,指向文档数据。
Elasticsearch是一个全文检索服务器(采用倒排索引加快查询效率),本质是一个java语言开发的Web项目,我们可以通过RESTful风格的接口访问该项目内部的Lucene,从而让全文搜索变得简单。
应用场景
我们可以使用Elasticsearch实现全站搜索,线上商城系统的搜索,分析日志等功能。
Elasticsearch与Solr区别
Solr也是基于Lucene的一款全文搜索引擎
1.Solr采用zookeeper进行分布式文件管理,而Elasticsearch自带分布式协调管理功能。
2.Solr支持多种数据类型,而Elasticsearch仅支持json类型
3.Elasticsearch在处理实时搜索应用时效率明显高于Solr
Elasticsearch的数据结构
在ES7.x之后删除了对于type的概念,因此一个索引不会代表一个库,而是代表一个表。
JAVA项目 | 项目 | 实体类 | 对象 | 属性 |
ES | index | Document | Filed | |
Mysql | Database | Table | Row | Column |
安装ES服务(单机版)
1.关闭防火墙
systemctl stop firewalld.service
2.关闭防火墙自启动
systemctl disable firewalld.service
3.配置最大可创建文件数大小
#打开系统文件:
vim /etc/sysctl.conf
#添加以下配置:
vm.max_map_count=655360
#配置生效:
sysctl -p
4.由于ES不能以root用户运行,我们需要创建一个非root用户,此处创建一个名为es的用户:
#创建用户:
useradd es
tar -zxvf elasticsearch-8.10.4-linux-x86_64.tar.gz -C /usr/local/
2.1 重命名
mv elasticsearch-8.10.4 elasticsearch1
2.2 es用户取得该文件夹权限
chown -R es:es /usr/local/elasticsearch1
3.启动ES服务
#切换到普通用户
su es
#进入到安装目录下的bin目录
cd /usr/local/elasticsearch1/bin/
#启动ES服务
./elasticsearch
4.当启动成功,可以看到类似以下的日志输出。首次启动 Elasticsearch,默认会启用安全配置功能,启用身份认证和授 权,内置超级用户 elastic 并生成默认密码,此时要注意保存,否则之后启动不会再显示。
4.重置密码
# 重置默认密码
cd /usr/local/elasticsearch1/bin/
./elasticsearch-reset-password -u elastic
# 自定义密码:
cd /usr/local/elasticsearch1/bin/
./elasticsearch-reset-password --username
elastic -i
5.连接ES,查询ES服务是否启动成功
# 参数 --cacert指定了证书
curl --cacert /usr/local/elasticsearch1/config/certs/http_ca.crt -u elastic https://localhost:9200
出现以下页面即成功启动