springboot + es 实现全文检索

一、背景

公司的后续的功能需要使用到全文检索,所以需要提前调研下全文检索,所以整理了下springboot+es实现全文检索的步骤,只是能跑通和执行一些简单的查询的功能。本人从零开始学习的,有些问题还请担待。

二、基础知识

1.es简介

全文搜索引擎 Elasticsearch 入门教程

Elasticsearch概述

因为springboot官方已经整合过es了,可以查看官方的文档

官方文档

三、环境搭建

1.下载安装

jdk需要1.8

es下载地址

全文检索的时候中文分词器使用ik分词器,ik分词器的版本需要和es的版本一致,或者查看ik的github地址,查看对应关系。

ik分词器下载地址

kibana可视化操作es

kibana下载地址

es下载解压后,打开bin目录,windows执行elasticsearch.bat 开启es。在浏览器中输入http://localhost:9200/即可访问,出现下图所示即访问成功:

然后在es目录的plugins下新建文件夹ik,将下载好的ik分词器解压到其中。注意,解压后的ik分词器包含很多jar文件和一个config文件夹。如果发现解压后发现下载的是ik源码。。。。那就自己打包一个就好,打包过程如下:

1.安装maven

2.在ik源码目录中打开cmd

3.执行mvn clean compile

4.执行mvn clean package

5.在target/releases目录下会有一个压缩文件,解压后复制到es/plugins/ik目录下

最后,启动es后如果没有报错说明启动成功,如果报错了。。。。。。看日志解决吧(都是坑)。

2.修改配置

在es安装目录,config下找到elasticsearch.yml文件,这个就是es配置文件。修改一下几个配置:

集群名称

cluster.name: 

节点名称

node.name:

修改为0.0.0.0运行自己以为的主机访问

network.host: 0.0.0.0   

允许跨域

http.cors.enabled: true 
http.cors.allow-origin: "*"

 

四、代码编写

1.pom文件添加es的依赖

        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
        </dependency>

2.配置文件设置

spring:
  data:
    elasticsearch:
      cluster-nodes: localhost:9300  #节点地址
      cluster-name: my-application  #集群名称
      repositories:
        enabled: true

3.实体类的编写

@Document(indexName = "test", type = "doc")  
public class TestItem {
    @Id
    private int id;
    @Field(type = FieldType.Text, searchAnalyzer = "ik_smart", analyzer = "ik_max_word")
    private String title;
    @Field(type = FieldType.Text, searchAnalyzer = "ik_smart", analyzer = "ik_max_word")
    private String content;

    public int getId() {
        return id;
    }

    public void setId(int id) {
        this.id = id;
    }

    public String getTitle() {
        return title;
    }

    public void setTitle(String title) {
        this.title = title;
    }

    public String getContent() {
        return content;
    }

    public void setContent(String content) {
        this.content = content;
    }
}

实体注解说明:

@Document:说明当前实体为文档主要使用俩个属性indexName和type

indexName:声明索引名称

type:声明type

@Field:字段注解,配置字段属性,主要属性如下

type:声明字段属性

searchAnalyzer:指定搜索分词器

analyer:指定分词器

ik分词器参数:

ik_smart: 为最少切分

ik_max_word:为最细粒度划分

4.repository编写

springboot提供了ElasticsearchCrudRepository 来执行基础的crud操作,如下所示:

public interface TestRespository extends ElasticsearchCrudRepository<TestItem,Long> {
    List<TestItem> findAll();

    List<TestItem> findAllByTitleContains(String title);

    TestItem findByTitleContains(String title);

    TestItem findByTitle(String title);
}

5.controller编写

    @Autowired
    private TestRespository testRespository;  
 
    @GetMapping("/addAll")
    public String addAll(){
        List<AchieventItem> all = achieventRepository.findAll(); 
        for (AchieventItem achieventItem : all) {
            TestItem testItem = new TestItem();
            testItem.setId(achieventItem.getId());
            testItem.setContent(achieventItem.getSubContent1());
            testItem.setTitle(achieventItem.getTitle());
            testRespository.save(testItem);   //保存到es中
        }
        return "success";
    }

    @GetMapping("/findByContiansTitle")
    public TestItem findByContiansTitle(@RequestParam(name = "k") String k){
        TestItem byTitleContains = testRespository.findByTitleContains(k);
        return byTitleContains;
    }

    @GetMapping("/findByTitle")
    public TestItem findByTitle(@RequestParam(name = "k") String k){
        TestItem byTitleContains = testRespository.findByTitle(k);
        return byTitleContains;
    }

6.高亮搜索词

如果有高亮需求需要使用到ElasticsearchTemplate这个类。

    @Autowired
    private ElasticsearchTemplate elasticsearchTemplate;    

    @GetMapping("/full")
    public List<TestItem> fullSearch(@RequestParam(name = "k") String k) {
        NativeSearchQueryBuilder builder = new NativeSearchQueryBuilder();
        HighlightBuilder highlightBuilder = new HighlightBuilder();
        highlightBuilder.requireFieldMatch(false);
        //对所有找到的搜索词添加同一个标签
//        highlightBuilder.field("title");
//        highlightBuilder.field("content");
//        highlightBuilder.preTags("<em>");
//        highlightBuilder.postTags("</em>");

        //对不同的关键词添加不同的标签
        HighlightBuilder.Field titleField = new HighlightBuilder.Field("title");  //高亮标题
        titleField.preTags("<title>"); //标题的开始标签
        titleField.postTags("</title>");//标题的结束标签
        HighlightBuilder.Field contentField = new HighlightBuilder.Field("content"); //高亮内容
        contentField.preTags("<content>"); //内容的开始标签
        contentField.postTags("</content>"); //内容的结束标签
        highlightBuilder.field(titleField);
        highlightBuilder.field(contentField);

        builder.withIndices("test");  //设置搜索的索引
        builder.withQuery(QueryBuilders.multiMatchQuery(k, "title", "content"));  //设置搜索的字段为title,content
        builder.withHighlightBuilder(highlightBuilder);  //添加高亮设置
        NativeSearchQuery query = builder.build();
        //带分页功能就使用queryForPage
//        AggregatedPage<TestItem> testItems = elasticsearchTemplate.queryForPage(query, TestItem.class, new DefaultResultMapper() {
//            @Override
//            public <T> AggregatedPage<T> mapResults(SearchResponse response, Class<T> clazz, Pageable pageable) {
//                return super.mapResults(response, clazz, pageable);
//            }
//        });
        List<TestItem> results = elasticsearchTemplate.query(query, new ResultsExtractor<List<TestItem>>() {
            @Override
            public List<TestItem> extract(SearchResponse searchResponse) {
                List<TestItem> items = new ArrayList<>();
                SearchHits hits = searchResponse.getHits();
                if (hits.totalHits == 0) {
                    return items;
                }
                TestItem item;
                for (SearchHit hit : hits) {
                    item = new TestItem();
                    Map<String, Object> source = hit.getSourceAsMap();
                    HighlightField hTitle = hit.getHighlightFields().get("title");  
                    if (hTitle != null) {  //如果不为空说明title中有高亮内容
                        item.setTitle(hTitle.getFragments()[0].toString());
                    } else {  //如果为null说明title没有高亮内容,从source中那对于的值
                        item.setTitle((String) source.get("title"));
                    }
                    HighlightField content = hit.getHighlightFields().get("content");
                    if (content != null) {
                        item.setContent(content.getFragments()[0].toString());
                    } else {
                        item.setContent((String) source.get("content"));
                    }
                    item.setId((Integer) source.get("id"));
                    items.add(item);
                }
                return items;
            }
        });
        return results;
    }

参考资料:

全文搜索引擎 Elasticsearch 入门教程

Elasticsearch概述

官方文档

springboot整合Elasticsearch

  • 0
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
### 回答1: Spring Boot是一个基于Java的开源框架,用于快速构建独立的、生产级别的应用程序。它简化了Spring框架的开发过程,提供了大量的默认配置,开发者只需关注业务逻辑的实现即可。 Elasticsearch是一个开源的分布式搜索和分析引擎,它使用倒排索引的方式进行高效的文本搜索。它提供了丰富、强大的查询语言和API,可以帮助我们构建高性能、可扩展的搜索应用。 要构建一个博客检索系统,可以使用Spring BootElasticsearch的组合。首先,我们可以使用Spring Boot搭建一个简单的web应用,用于展示博客内容和处理用户请求。Spring Boot提供了快速开发的能力,可以方便地构建页面和处理数据。 然后,我们需要将博客的内容导入到Elasticsearch中进行索引。可以编写一个程序,通过Elasticsearch提供的API将博客内容导入到索引中。这样,我们就可以通过Elasticsearch的查询语言来搜索博客文章。 最后,我们可以在Spring Boot应用中编写一个搜索接口,通过接收用户的搜索关键字,调用Elasticsearch的API进行查询,并将查询结果返回给用户。用户可以根据搜索结果点击进入详细页面查看博客内容。 构建博客检索系统需要注意索引的更新问题,当博客内容发生变化时,需要及时同步到Elasticsearch的索引中,以确保数据的最新性。可以使用定时任务或者监听数据库变化的方式实现索引的更新。 总结来说,使用Spring BootElasticsearch可以快速构建一个博客检索系统。Spring Boot提供了便捷的开发环境,而Elasticsearch提供了强大的搜索和分析引擎,帮助我们实现高性能的搜索功能。 ### 回答2: Spring Boot是一个用于简化Spring应用开发的框架,它通过提供默认的配置和约定来简化Java应用程序的开发过程。Elasticsearch是一个开源的分布式搜索和分析引擎,可以高效地存储、检索和分析大量结构化和非结构化数据。 通过使用Spring BootElasticsearch,我们可以构建一个免费的博客检索系统。首先,我们可以使用Spring Boot框架来开发一个简单的博客应用,在其中包括博客的标题、内容、作者和发布时间等基本信息。我们可以使用Spring Data Elasticsearch来集成Elasticsearch搜索功能,并将博客的相关信息存储在Elasticsearch的索引中。 接下来,我们可以利用Elasticsearch的强大的搜索和查询功能来构建一个可靠和高效的博客检索系统。通过对博客索引进行全文搜索,用户可以根据关键词搜索博客,系统会返回与关键词相关的博客内容。 除了基本的搜索功能,我们还可以通过利用Elasticsearch的聚合功能来实现更复杂的检索需求。例如,我们可以计算某个时间段内博客的发布数量,或者根据作者分组计算每个作者的博客数量。这些聚合操作可以帮助我们快速获取博客数据的统计信息,以实现更细粒度的博客检索。 总之,利用Spring BootElasticsearch,我们可以构建一个免费的博客检索系统,提供强大的全文搜索和聚合功能,帮助用户快速找到他们感兴趣的博客内容。这个系统不仅易于开发和维护,还能够处理大量的博客数据,提供稳定和高效的检索服务。 ### 回答3: Spring Boot是一种用于快速开发Java应用程序的框架,而Elasticsearch是一个开源的分布式搜索引擎。结合两者,可以构建一个强大的博客检索系统。 首先,我们可以使用Spring Boot框架来构建博客系统的后端。通过使用Spring Boot的自动配置和约定优于配置的设计原则,我们可以快速搭建一个可靠的后端应用程序。我们可以使用Spring MVC来处理前端请求,并使用Spring Data来与数据库进行交互和管理数据。通过使用Spring Security可以确保博客系统的安全性。 其次,我们需要集成Elasticsearch作为博客系统的搜索引擎。Elasticsearch是一个分布式的实时搜索和分析引擎,具有强大的全文搜索能力和高性能。我们可以通过使用Spring Data Elasticsearch模块来简化与Elasticsearch的交互,它提供了丰富的API来执行各种搜索操作。 在博客系统中,我们可以使用Elasticsearch建立博客的全文索引。当用户进行搜索时,我们可以使用Elasticsearch的查询语言来执行搜索操作,并返回与查询相关的博客文章。我们可以使用Elasticsearch的分词、关键字匹配和模糊搜索等功能来提高搜索的准确性和效率。 为了提升用户体验,我们可以使用Elasticsearch的聚合功能来生成搜索建议和热门标签等。这样用户可以更方便地找到他们想要的博客内容。 综上所述,通过免费课程学习Spring BootElasticsearch,我们可以构建一个功能强大的博客检索系统。这将使用户能够轻松搜索并获取他们所需的博客文章。同时,使用Spring BootElasticsearch的优势,我们可以快速开发和部署这个系统,并保证其可靠性和性能。
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值