Java 集合去掉重复数据,并取其中第一条方式

weng@

已于 2023-08-21 14:29:01 修改

阅读量4.1k

点赞数

分类专栏： java 学习文章标签： java 数据库 sql

于 2022-09-08 20:23:43 首次发布

本文链接：https://blog.csdn.net/weng74/article/details/126771478

版权

java 同时被 2 个专栏收录

10 篇文章 2 订阅

订阅专栏

学习

9 篇文章 2 订阅

订阅专栏

Java 集合去掉重复数据,并取其中第一条方式

假设有这么一个场景：

业务给这个商品A报价，其中业务A 和业务B 都可以给A报价并且报多次,这个时候就会有这样一个需求，根据商品加业务员取商品，如果存在重复的数据取报价时长最长的这条

这个时候就想到在sql 里面一次性查询出来使用row_number() 方法

        select  user_id, product_id,validity_time
        FROM (
        select
    pp.user_id,  
        PP.product_id,
      PP.validity_time,
        row_number() over ( partition by  PP.product_id order by PP.validity_time desc )  as row_number
        from  xxxx   as PP where pp.user_id =#{param1}
        ) as PP
        where PP.row_number = 1

这个时候确实就可以完成本次需求，需要每次在查询的结果集后再单独去查询一次db,这样就会带来一个问题查询慢，导致业务提故障，这个时候我们就要考虑去优化这个，可以将上面的sql 把分页数据一次性带入查询处理，查询这些条件下的数据，转成map,再去map.get() 这样就减少了多次查询的问题，这个带来了一个问题我们根据 PP.product_id 去分这样就会存在只能存在一个商品，但是我们的商品是可以让多个业务去报价的一定会存在一个商品多个业务的情况，这个时候就不能考虑使用row_number() 来处理了，这个时候sql 就只是简单的查询就行,

在代码层面去处理

select
    pp.user_id,  
        PP.product_id,
      PP.validity_time,
        from  xxxx   as PP where( pp.user_id =#{param1} or pp.user_id =#{param2} ....)

这个时候就有2种方法

1.利用Collectors.toMap 第三个参数（a,b）->a 去重拿到一个去重后的数据如果存在重复的就取一条

 // 获取 有效的报价数据
        List<XXXXXX> firstList =
                this.xxxDao.findXXXX(paramList);
 // 去重后的
        List<XXXXXX>   lastFilterList = new ArrayList<>();

 // 去重 拿到第一个数据
        Map<String, XXXXXX> deduplicationMap = validQuoteSkuNumNewList.stream()
                .collect(Collectors.toMap(i -> i.getUserId() + "-" + i.getProductId(), i -> i,(a,b)->a));
// 取出里面的value 就能得到一个不重复的
  deduplicationMap.forEach((key,value)->{
            lastFilterList.add(value);
        });

2.利用Collectors.collectingAndThen 分组后取其中的一个这种不能避免只有一个商品的情况但也是一种代替row_number 的方法

 // 获取 有效的报价数据
        List<XXXXXX> firstList =
                this.xxxDao.findXXXX(paramList);
 // 去重后的
        List<XXXXXX>   lastFilterList = new ArrayList<>();

 // 去重 拿到第一个数据
        Map<String, ProductPurchasePriceErpVO> deduplicationMap = validQuoteSkuNumNewList.stream().collect(Collectors.groupingBy(ProductPurchasePriceErpVO::getProductCode
                , Collectors.collectingAndThen(Collectors.toList(), value -> value.get(0))));
    
// 取出里面的value 就能得到一个不重复的
  deduplicationMap.forEach((key,value)->{
            lastFilterList.add(value);
        });

3.mysql5.7 没有 row_number() 函数要嵌套表关联实现如果mysql 8.0 可以忽略这个使用一个max() 加分组取出其中的一条关联查询嵌套查询3次拿出最新的这样确实恶心这个时候建议代码中实现。

select o.order_id,pr.order_id
from o_order as o
         inner join (select p1.order_id,p1.record_id
                     from o_pay_record as p1
                              inner join (select p2.order_id, max(p2.create_time) as max_time
                                          from o_pay_record as p2
                                          group by p2.order_id) as p2
                                         on p1.order_id = p2.order_id and p2.max_time = p1.create_time
                     ) as pr
                    on pr.order_id = o.order_id
where o.order_number = 'ON23081614210001'