Elasticsearch入门级使用教程

最新推荐文章于 2024-08-11 18:53:25 发布

北城望戈

最新推荐文章于 2024-08-11 18:53:25 发布

阅读量2.1k

点赞数 2

分类专栏： Java项目相关

本文链接：https://blog.csdn.net/carolineme/article/details/115672015

版权

Java项目相关专栏收录该内容

8 篇文章 0 订阅

订阅专栏

分布式搜索引擎概述：

倒排索引：在搜索引擎中，每个文档都有一个对应的文档ID，文档内容被表示为一系列关键词的集合。倒排索引就是关键词到文档ID的映射，每个关键词都对应着一系列的文件，这些文件中都出现了关键词。

倒排索引中的所有词项对应一个或多个文档；
倒排索引中的词项根据字典顺序升序排列

Luence是一个开源的全文检索引擎工具包（类似于Java API），而ElasticSerach底层是基于这些包，对其进行了扩展，提供了比Luence更为丰富的查询语言，可以非常方便的通过Elasticsearch的HTTP接口与底层Luence交互。

ElasticSearch和Solr：当实时建立索引的时候，Solr会产生阻塞，而es不会，es查询性能要高于solr；在不断动态添加数据的时候，solr的检索效率会变的低下，而es则没有什么变化；Solr利用zookeeper进行分布式管理，而es自身带有分布式系统管理功能。Solr一般都要部署到web服务器，比如tomcat，启动tomcat的时候需要配置tomcat和solr的管理，solr的本质是一个动态的web项目；solr支持更多的数据格式（xml、json、csv等），而es仅支持json文件格式；Solr是传统搜索应用的有力解决方案，但是es更适用于新兴的实时搜索应用。单纯的对已有数据进行检索的时候，solr的效率高于es；solr官网提供的功能更多，而es本身更注重于核心功能，攻击功能有第三方插件。

1、Elasticsearch入门

Elasticsearch简介：一个分布式的、Restful风格（前后端交互的标准，http请求的格式）的搜索引擎；支持对各种类型的数据的检索；搜索速度快，可以提供实时的服务；便于水平扩展（集群时增加服务器），每秒可以处理PB级海量数据。

本质上是一个分布式数据库。

Elasticsearch术语：

索引、类型、文档、字段，与数据库的定义相对应，即database、table、row、column

集群、节点、分片（对索引进行划分，提高并发能力）、副本(备份)。

在多台机器上启动多个es进程实例，组成了一个es集群。

2、Elasticsearch安装配置

需要安装elasticsearch和分词插件两个工具。直接下载压缩文件解压缩即可，修改配置文件。

es下载网址：https://www.elastic.co/cn/downloads/past-releases/elasticsearch-6-4-3

解压缩后更改配置文件：cluster.name(集群名字)、path.data(存储数据的路径)、path.log(日志路径)

分词插件下载：https://github.com/medcl/elasticseatch-analysis-ik/releases/tag/v6.4.3

加压缩到es的plugins目录并新建ik文件夹下。

启动es：elasticsearch.bat

3、Spring整合Elasticsearch

redis和elasticsearch都是基于netty，解决netty启动冲突问题：

    @PostConstruct
    public void init() {
        // 解决netty启动冲突问题
        // see Netty4Utils.setAvailableProcessors()
        System.setProperty("es.set.netty.runtime.available.processors", "false");
    }

使用：数据库中的表和es中的索引对应。注解的方式实现。

实体类上加@Document注解，属性上面加@Id、@Field 注解。

@Document(indexName = "discusspost", type = "_doc", shards = 6, replicas = 3)
@Id
@Field(type = FieldType.Text, analyzer = "ik_max_word", searchAnalyzer = "ik_smart")

dao层定义实现 ElasticsearchRepository的接口，不需要声明任何方法，里面封装了相应的查询、增加、删除等方法。

使用时直接注入上述定义的repository接口，调用相应方法即可完成业务逻辑。ElasticsearchTemplate用来解决repository处理不了的情况，使用时直接注入。