如何在java项目中使用ES

最新推荐文章于 2024-08-31 21:16:47 发布

KeLe鸭

最新推荐文章于 2024-08-31 21:16:47 发布

阅读量2.2k

点赞数 8

分类专栏： Java 文章标签： springboot java elasticsearch 搜索引擎

本文链接：https://blog.csdn.net/qq_45993474/article/details/136399197

版权

Java 专栏收录该内容

16 篇文章 0 订阅

订阅专栏

引入es的依赖库

 <!-- elasticsearch-->
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-data-elasticsearch</artifactId>
        </dependency>

创建一个接口来从es里面查询数据 service文件中

 /**
     * 从 ES 查询
     *
     * @param postQueryRequest
     * @return
     */
    Page<Post> searchFromEs(PostQueryRequest postQueryRequest);

// postQueryRequest是封装的请求参数类，主要需要传入的字段就是searchText（搜索关键词）

实现该接口（ES负责的是静态查询，将查询结果对应的文档id找到之后再返回到mysql里面查询更加完整的数据）

public Page<Post> searchFromEs(PostQueryRequest postQueryRequest) {
        // 01. 将所有的参数给单独提取出来
        String searchText = postQueryRequest.getSearchText();
        // 02. 指定查询的数据的页数 es 起始页为 0
        long current = postQueryRequest.getCurrent() - 1;
        long pageSize = postQueryRequest.getPageSize();

        // 03. 创建一个查询对象
        BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery();

        // 04. 查询条件过滤
        boolQueryBuilder.filter(QueryBuilders.termQuery("isDelete", 0));
        // 05. 判断是否有传入以下的查询条件，如果有的话就加入到查询条件中
        // 按关键词检索
        if (StringUtils.isNotBlank(searchText)) {
            boolQueryBuilder.should(QueryBuilders.matchQuery("title", searchText));
            boolQueryBuilder.should(QueryBuilders.matchQuery("description", searchText));
            boolQueryBuilder.should(QueryBuilders.matchQuery("content", searchText));
            boolQueryBuilder.minimumShouldMatch(1);  // 至少匹配一个
        }
        // 分页
        PageRequest pageRequest = PageRequest.of((int) current, (int) pageSize);
        // 构造排序的查询
//        NativeSearchQuery searchQuery = new NativeSearchQueryBuilder().withQuery(boolQueryBuilder)
//                .withPageable(pageRequest).withSorts(sortBuilder).build();

        // 构造没有排序的查询
        NativeSearchQuery searchQuery = new NativeSearchQueryBuilder().withQuery(boolQueryBuilder)
                .withPageable(pageRequest).build();

        // 将所有的查询结果都取出来
        SearchHits<PostEsDTO> searchHits = elasticsearchRestTemplate.search(searchQuery, PostEsDTO.class);

        Page<Post> page = new Page<>();
        // 将查询的结果添加到page对象里面
        page.setTotal(searchHits.getTotalHits());

        List<Post> resourceList = new ArrayList<>();
        // 查出结果后，从 db 获取最新动态数据（比如点赞数）     es负责进行静态数据的筛选，然后在回表到mysql里面将所有的数据信息查出来
        if (searchHits.hasSearchHits()) {
            List<SearchHit<PostEsDTO>> searchHitList = searchHits.getSearchHits();
            // 将查询到的文档id使用列表进行存储
            List<Long> postIdList = searchHitList.stream().map(searchHit -> searchHit.getContent().getId())
                    .collect(Collectors.toList());
            // 根据这个文档id查询 mysql里面的数据  使用列表存储
            List<Post> postList = baseMapper.selectBatchIds(postIdList);
            if (postList != null) {
                // 根据文章id进行分组
                Map<Long, List<Post>> idPostMap = postList.stream().collect(Collectors.groupingBy(Post::getId));

                // 如果查询到的mysql的集合里面包含上面es中查询到的文档id就取出来放到resource列表中存储
                postIdList.forEach(postId -> {
                    if (idPostMap.containsKey(postId)) {
                        resourceList.add(idPostMap.get(postId).get(0));
                    } else {
                        // 从 es 清空 db 已物理删除的数据   不包含的话就直接删除
                        String delete = elasticsearchRestTemplate.delete(String.valueOf(postId), PostEsDTO.class);
                        log.info("delete post {}", delete);
                    }
                });
            }
        }
        // 设置到records中支持分页存储
        page.setRecords(resourceList);
        return page;
    }

然后在需要查询es里面数据的地方调用该接口就行

 @Override
    public Page<PostVO> doSearch(String searchText, int pageSize, int pageNum) {
        PostQueryRequest postQueryRequest = new PostQueryRequest();
        postQueryRequest.setSearchText(searchText);
        postQueryRequest.setPageSize(pageSize);
        postQueryRequest.setCurrent(pageNum);
        // 这里因为不能在传入request参数  所以就将request参数从requestHolder里面获取
        ServletRequestAttributes requestAttributes = (ServletRequestAttributes) RequestContextHolder.getRequestAttributes();
        HttpServletRequest request = requestAttributes.getRequest();
        // 将查询帖子的接口转到es里面去进行查询    调用es查询的接口
        Page<Post> postPage = postService.searchFromEs(postQueryRequest);
        Page<PostVO> postVOPage = postService.getPostVOPage(postPage, request);
//        Page<PostVO> postResult = postService.listPostVOByPage(postQueryRequest, request);
        return postVOPage;
    }

上面的接口实现出现了一个问题，就是我们的es里面根本就没有任何的数据，所以也就无从查起了

es里面一般负责静态数据的查询，然后将结构查询出来之后（关联的文档id）再到mysql里面进行动态数据的查询

这时我们需要将mysql的数据同步到es里面，但不是全部的数据同步，而是只需要同步部分字段的数据即可，比如这里需要同步id，title，content, description

数据库数据同步的方式有很多种，这里我们采用的时定时任务的方式进行数据同步（占用资源少，不用引入第三方插件，适用于不需要太实时同步数据的场景）

创建一个es表的实体类

package com.yupi.springbootinit.model.dto.post;

import cn.hutool.core.collection.CollUtil;
import cn.hutool.json.JSONUtil;
import com.yupi.springbootinit.model.entity.Post;
import lombok.Data;

import org.apache.commons.lang3.StringUtils;
import org.springframework.beans.BeanUtils;
import org.springframework.data.annotation.Id;
import org.springframework.data.elasticsearch.annotations.Document;
import org.springframework.data.elasticsearch.annotations.Field;
import org.springframework.data.elasticsearch.annotations.FieldType;

import java.io.Serializable;
import java.util.Date;
import java.util.List;

/**
 * 帖子 ES 包装类
 *
 **/
// todo 取消注释开启 ES（须先配置 ES）
@Document(indexName = "post")   // es的文档索引（表名）
@Data
public class PostEsDTO implements Serializable {

    private static final String DATE_TIME_PATTERN = "yyyy-MM-dd'T'HH:mm:ss.SSS'Z'";

    /**
     * id  必须打上id注解
     */
    @Id
    private Long id;

    /**
     * 标题
     */
    private String title;

    /**
     * 内容
     */
    private String content;

    /**
     * 标签列表
     */
    private List<String> tags;

    /**
     * 创建用户 id
     */
    private Long userId;

    /**
     * 创建时间  解析时间使得java时间和es时间符合
     */
    @Field(index = false, store = true, type = FieldType.Date, format = {}, pattern = DATE_TIME_PATTERN)
    private Date createTime;

    /**
     * 更新时间
     */
    @Field(index = false, store = true, type = FieldType.Date, format = {}, pattern = DATE_TIME_PATTERN)
    private Date updateTime;

    /**
     * 是否删除
     */
    private Integer isDelete;

    private static final long serialVersionUID = 1L;

    /**
     * 对象转包装类
     *
     * @param post
     * @return
     */
    public static PostEsDTO objToDto(Post post) {
        if (post == null) {
            return null;
        }
        PostEsDTO postEsDTO = new PostEsDTO();
        BeanUtils.copyProperties(post, postEsDTO);
        String tagsStr = post.getTags();
        if (StringUtils.isNotBlank(tagsStr)) {
            postEsDTO.setTags(JSONUtil.toList(tagsStr, String.class));
        }
        return postEsDTO;
    }

    /**
     * 包装类转对象
     *
     * @param postEsDTO
     * @return
     */
    public static Post dtoToObj(PostEsDTO postEsDTO) {
        if (postEsDTO == null) {
            return null;
        }
        Post post = new Post();
        BeanUtils.copyProperties(postEsDTO, post);
        List<String> tagList = postEsDTO.getTags();
        if (CollUtil.isNotEmpty(tagList)) {
            post.setTags(JSONUtil.toJsonStr(tagList));
        }
        return post;
    }
}

创建一个全量的同步任务（只在项目启动的时候进行一次同步，用完之后记得将注解注释掉，这样下次就不会再执行）

// todo 取消注释开启任务
//@Component
@Slf4j
// CommandLineRunner是一个接口用于在程序启动之后进行一些初始化方法执行，可以重写里面的run方法即可
public class FullSyncPostToEs implements CommandLineRunner {

    @Resource
    private PostService postService;

    @Resource
    private PostEsDao postEsDao;

    @Override
    public void run(String... args) {
        // 01. 查询里面所有的数据
        List<Post> postList = postService.list();
        if (CollUtil.isEmpty(postList)) {
            return;
        }
        // 02. 将post查询的所有数据的tags取出来 转换为一个新的对象PostEsDTO  同时将里面的tags由json格式转为string格式
        List<PostEsDTO> postEsDTOList = postList.stream().map(post -> PostEsDTO.objToDto(post)).collect(Collectors.toList());
//        List<PostEsDTO> postEsDTOList = postList.stream().map(PostEsDTO::objToDto).collect(Collectors.toList());
        // 03. 一次最多同步500条数据到es里面
        final int pageSize = 500;
        int total = postEsDTOList.size();
        log.info("FullSyncPostToEs start, total {}", total);
        for (int i = 0; i < total; i += pageSize) {
            int end = Math.min(i + pageSize, total);
            log.info("sync from {} to {}", i, end);
            postEsDao.saveAll(postEsDTOList.subList(i, end));
        }
        log.info("FullSyncPostToEs end, total {}", total);
    }
}

增量同步（通过定时任务的方式来判断数据更新的时间从而进行数据的同步）

@Component
@Slf4j
public class IncSyncPostToEs {

    @Resource
    private PostMapper postMapper;

    @Resource
    private PostEsDao postEsDao;

    /**
     * 每分钟执行一次
     */
    @Scheduled(fixedRate = 60 * 1000)
    public void run() {
        // 查询5分钟内的数据
        Date fiveMinutesAgoDate = new Date(new Date().getTime() - 5 * 60 * 1000L);
        // sql查询  写在mapper里面的
        List<Post> postList = postMapper.listPostWithDelete(fiveMinutesAgoDate);
        if (CollUtil.isEmpty(postList)) {
            log.info("no inc post");
            return;
        }
        // 将数据进行转换为新的对象格式 PostEsDTO类型
        List<PostEsDTO> postEsDTOList = postList.stream()
                .map(PostEsDTO::objToDto)
                .collect(Collectors.toList());
        // 最多只能同步500条数据
        final int pageSize = 500;
        int total = postEsDTOList.size();
        log.info("IncSyncPostToEs start, total {}", total);
        for (int i = 0; i < total; i += pageSize) {
            int end = Math.min(i + pageSize, total);
            log.info("sync from {} to {}", i, end);
            postEsDao.saveAll(postEsDTOList.subList(i, end));
        }
        log.info("IncSyncPostToEs end, total {}", total);
    }
}

总结：ES引入到java客户端使用的方法

首先引入对应的ES依赖库
然后进行ES的数据同步（创建ES实体封装类，编写定时任务）
数据同步成功之后编写对应的查询接口以及接口实现类，实现类里面具体执行对es数据库的查询【注意这里返回的不是es里面的数据，而是返回的关联的文档ID，将该ID取出来之后去mysql数据库里面查询和ID相等的完整的动态数据才是我们需要的结果】
调用接口获取数据，响应给前端即可