-
引入es的依赖库
<!-- elasticsearch--> <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-elasticsearch</artifactId> </dependency>
-
创建一个接口来从es里面查询数据 service文件中
/** * 从 ES 查询 * * @param postQueryRequest * @return */ Page<Post> searchFromEs(PostQueryRequest postQueryRequest); // postQueryRequest是封装的请求参数类,主要需要传入的字段就是searchText(搜索关键词)
-
实现该接口 (ES负责的是静态查询,将查询结果对应的文档id找到之后再返回到mysql里面查询更加完整的数据)
public Page<Post> searchFromEs(PostQueryRequest postQueryRequest) { // 01. 将所有的参数给单独提取出来 String searchText = postQueryRequest.getSearchText(); // 02. 指定查询的数据的页数 es 起始页为 0 long current = postQueryRequest.getCurrent() - 1; long pageSize = postQueryRequest.getPageSize(); // 03. 创建一个查询对象 BoolQueryBuilder boolQueryBuilder = QueryBuilders.boolQuery(); // 04. 查询条件过滤 boolQueryBuilder.filter(QueryBuilders.termQuery("isDelete", 0)); // 05. 判断是否有传入以下的查询条件,如果有的话就加入到查询条件中 // 按关键词检索 if (StringUtils.isNotBlank(searchText)) { boolQueryBuilder.should(QueryBuilders.matchQuery("title", searchText)); boolQueryBuilder.should(QueryBuilders.matchQuery("description", searchText)); boolQueryBuilder.should(QueryBuilders.matchQuery("content", searchText)); boolQueryBuilder.minimumShouldMatch(1); // 至少匹配一个 } // 分页 PageRequest pageRequest = PageRequest.of((int) current, (int) pageSize); // 构造排序的查询 // NativeSearchQuery searchQuery = new NativeSearchQueryBuilder().withQuery(boolQueryBuilder) // .withPageable(pageRequest).withSorts(sortBuilder).build(); // 构造没有排序的查询 NativeSearchQuery searchQuery = new NativeSearchQueryBuilder().withQuery(boolQueryBuilder) .withPageable(pageRequest).build(); // 将所有的查询结果都取出来 SearchHits<PostEsDTO> searchHits = elasticsearchRestTemplate.search(searchQuery, PostEsDTO.class); Page<Post> page = new Page<>(); // 将查询的结果添加到page对象里面 page.setTotal(searchHits.getTotalHits()); List<Post> resourceList = new ArrayList<>(); // 查出结果后,从 db 获取最新动态数据(比如点赞数) es负责进行静态数据的筛选,然后在回表到mysql里面将所有的数据信息查出来 if (searchHits.hasSearchHits()) { List<SearchHit<PostEsDTO>> searchHitList = searchHits.getSearchHits(); // 将查询到的文档id使用列表进行存储 List<Long> postIdList = searchHitList.stream().map(searchHit -> searchHit.getContent().getId()) .collect(Collectors.toList()); // 根据这个文档id查询 mysql里面的数据 使用列表存储 List<Post> postList = baseMapper.selectBatchIds(postIdList); if (postList != null) { // 根据文章id进行分组 Map<Long, List<Post>> idPostMap = postList.stream().collect(Collectors.groupingBy(Post::getId)); // 如果查询到的mysql的集合里面包含上面es中查询到的文档id就取出来放到resource列表中存储 postIdList.forEach(postId -> { if (idPostMap.containsKey(postId)) { resourceList.add(idPostMap.get(postId).get(0)); } else { // 从 es 清空 db 已物理删除的数据 不包含的话就直接删除 String delete = elasticsearchRestTemplate.delete(String.valueOf(postId), PostEsDTO.class); log.info("delete post {}", delete); } }); } } // 设置到records中支持分页存储 page.setRecords(resourceList); return page; }
-
然后在需要查询es里面数据的地方调用该接口就行
@Override public Page<PostVO> doSearch(String searchText, int pageSize, int pageNum) { PostQueryRequest postQueryRequest = new PostQueryRequest(); postQueryRequest.setSearchText(searchText); postQueryRequest.setPageSize(pageSize); postQueryRequest.setCurrent(pageNum); // 这里因为不能在传入request参数 所以就将request参数从requestHolder里面获取 ServletRequestAttributes requestAttributes = (ServletRequestAttributes) RequestContextHolder.getRequestAttributes(); HttpServletRequest request = requestAttributes.getRequest(); // 将查询帖子的接口转到es里面去进行查询 调用es查询的接口 Page<Post> postPage = postService.searchFromEs(postQueryRequest); Page<PostVO> postVOPage = postService.getPostVOPage(postPage, request); // Page<PostVO> postResult = postService.listPostVOByPage(postQueryRequest, request); return postVOPage; }
-
上面的接口实现出现了一个问题,就是我们的es里面根本就没有任何的数据,所以也就无从查起了
-
es里面一般负责静态数据的查询,然后将结构查询出来之后(关联的文档id)再到mysql里面进行动态数据的查询
-
这时我们需要将mysql的数据同步到es里面,但不是全部的数据同步,而是只需要同步部分字段的数据即可,比如这里需要同步id,title,content, description
-
数据库数据同步的方式有很多种,这里我们采用的时定时任务的方式进行数据同步(占用资源少,不用引入第三方插件,适用于不需要太实时同步数据的场景)
-
创建一个es表的实体类
package com.yupi.springbootinit.model.dto.post; import cn.hutool.core.collection.CollUtil; import cn.hutool.json.JSONUtil; import com.yupi.springbootinit.model.entity.Post; import lombok.Data; import org.apache.commons.lang3.StringUtils; import org.springframework.beans.BeanUtils; import org.springframework.data.annotation.Id; import org.springframework.data.elasticsearch.annotations.Document; import org.springframework.data.elasticsearch.annotations.Field; import org.springframework.data.elasticsearch.annotations.FieldType; import java.io.Serializable; import java.util.Date; import java.util.List; /** * 帖子 ES 包装类 * **/ // todo 取消注释开启 ES(须先配置 ES) @Document(indexName = "post") // es的文档索引(表名) @Data public class PostEsDTO implements Serializable { private static final String DATE_TIME_PATTERN = "yyyy-MM-dd'T'HH:mm:ss.SSS'Z'"; /** * id 必须打上id注解 */ @Id private Long id; /** * 标题 */ private String title; /** * 内容 */ private String content; /** * 标签列表 */ private List<String> tags; /** * 创建用户 id */ private Long userId; /** * 创建时间 解析时间使得java时间和es时间符合 */ @Field(index = false, store = true, type = FieldType.Date, format = {}, pattern = DATE_TIME_PATTERN) private Date createTime; /** * 更新时间 */ @Field(index = false, store = true, type = FieldType.Date, format = {}, pattern = DATE_TIME_PATTERN) private Date updateTime; /** * 是否删除 */ private Integer isDelete; private static final long serialVersionUID = 1L; /** * 对象转包装类 * * @param post * @return */ public static PostEsDTO objToDto(Post post) { if (post == null) { return null; } PostEsDTO postEsDTO = new PostEsDTO(); BeanUtils.copyProperties(post, postEsDTO); String tagsStr = post.getTags(); if (StringUtils.isNotBlank(tagsStr)) { postEsDTO.setTags(JSONUtil.toList(tagsStr, String.class)); } return postEsDTO; } /** * 包装类转对象 * * @param postEsDTO * @return */ public static Post dtoToObj(PostEsDTO postEsDTO) { if (postEsDTO == null) { return null; } Post post = new Post(); BeanUtils.copyProperties(postEsDTO, post); List<String> tagList = postEsDTO.getTags(); if (CollUtil.isNotEmpty(tagList)) { post.setTags(JSONUtil.toJsonStr(tagList)); } return post; } }
-
创建一个全量的同步任务(只在项目启动的时候进行一次同步,用完之后记得将注解注释掉,这样下次就不会再执行)
// todo 取消注释开启任务 //@Component @Slf4j // CommandLineRunner是一个接口用于在程序启动之后进行一些初始化方法执行,可以重写里面的run方法即可 public class FullSyncPostToEs implements CommandLineRunner { @Resource private PostService postService; @Resource private PostEsDao postEsDao; @Override public void run(String... args) { // 01. 查询里面所有的数据 List<Post> postList = postService.list(); if (CollUtil.isEmpty(postList)) { return; } // 02. 将post查询的所有数据的tags取出来 转换为一个新的对象PostEsDTO 同时将里面的tags由json格式转为string格式 List<PostEsDTO> postEsDTOList = postList.stream().map(post -> PostEsDTO.objToDto(post)).collect(Collectors.toList()); // List<PostEsDTO> postEsDTOList = postList.stream().map(PostEsDTO::objToDto).collect(Collectors.toList()); // 03. 一次最多同步500条数据到es里面 final int pageSize = 500; int total = postEsDTOList.size(); log.info("FullSyncPostToEs start, total {}", total); for (int i = 0; i < total; i += pageSize) { int end = Math.min(i + pageSize, total); log.info("sync from {} to {}", i, end); postEsDao.saveAll(postEsDTOList.subList(i, end)); } log.info("FullSyncPostToEs end, total {}", total); } }
-
增量同步(通过定时任务的方式来判断数据更新的时间从而进行数据的同步)
@Component @Slf4j public class IncSyncPostToEs { @Resource private PostMapper postMapper; @Resource private PostEsDao postEsDao; /** * 每分钟执行一次 */ @Scheduled(fixedRate = 60 * 1000) public void run() { // 查询5分钟内的数据 Date fiveMinutesAgoDate = new Date(new Date().getTime() - 5 * 60 * 1000L); // sql查询 写在mapper里面的 List<Post> postList = postMapper.listPostWithDelete(fiveMinutesAgoDate); if (CollUtil.isEmpty(postList)) { log.info("no inc post"); return; } // 将数据进行转换为新的对象格式 PostEsDTO类型 List<PostEsDTO> postEsDTOList = postList.stream() .map(PostEsDTO::objToDto) .collect(Collectors.toList()); // 最多只能同步500条数据 final int pageSize = 500; int total = postEsDTOList.size(); log.info("IncSyncPostToEs start, total {}", total); for (int i = 0; i < total; i += pageSize) { int end = Math.min(i + pageSize, total); log.info("sync from {} to {}", i, end); postEsDao.saveAll(postEsDTOList.subList(i, end)); } log.info("IncSyncPostToEs end, total {}", total); } }
-
总结:ES引入到java客户端使用的方法
- 首先引入对应的ES依赖库
- 然后进行ES的数据同步(创建ES实体封装类,编写定时任务)
- 数据同步成功之后编写对应的查询接口以及接口实现类,实现类里面具体执行对es数据库的查询【注意这里返回的不是es里面的数据,而是返回的关联的文档ID,将该ID取出来之后去mysql数据库里面查询和ID相等的完整的动态数据才是我们需要的结果】
- 调用接口获取数据,响应给前端即可