fastJosn读取超大josn文件并用Map去重复

**

fastJosn读取超大josn文件并用Map去重复

**

超大josn文本格式(简单示例):

[{“OrderID”:“001”,“OrderNo”:“A001”}
{“OrderID”:“002”,“OrderNo”:“A002”}
{“OrderID”:“003”,“OrderNo”:“A003”}
{“OrderID”:“004”,“OrderNo”:“A004”}]

MAVEN依赖

com.alibaba fastjson 1.2.9 commons-io commons-io 2.6

实体类

public class Order{

    private String orderId;
    private String orderNo;


    public String getOrderId() {
        return orderId;
    }

    public void setOrderId(String orderId) {
        this.orderId = orderId;
    }

    public String getOrderNo() {
        return orderNo;
    }

    public void setOrderNo(String orderNo) {
        this.orderNo = orderNo;
    }

    @Override
    public String toString() {
        return "Order{" +
                "orderId='" + orderId + '\'' +
                ", orderNo='" + orderNo + '\'' +
                '}';
    }
}

测试类


import com.alibaba.fastjson.JSON;
import org.apache.commons.io.IOUtils;
import java.util.Map.Entry;
import java.util.*;
import java.io.*;

/*
文本文件内容:
[{"OrderID":"001","OrderNo":"A001"}
{"OrderID":"002","OrderNo":"A002"}
{"OrderID":"003","OrderNo":"A003"}
{"OrderID":"004","OrderNo":"A004"}]

基本思路:
1.com.alibaba.fastjson 读取josn文件到List
2.提取重复的放入一个list  利用map.containsKey()
3.提取不重复的放入另一个list 这里提供三种方式
* */
public class MapTest {

    public static void main(String[] args) {

        long start=System.currentTimeMillis();
        try {
        InputStream inputStream = new FileInputStream("E:\\IDEASOURCE\\text\\data5000000.json");
        String text = IOUtils.toString(inputStream,"utf8");
        List<Order> testList= JSON.parseArray(text, Order.class);

        List<Order> repeatList = new ArrayList<Order>();//用于存放重复的元素的list
        List<Order> soleList = new ArrayList<Order>();//用于存放不重复的元素的list
        List<Order> soleList2 = new ArrayList<Order>();//用于存放不重复的元素的list
        List<Order> soleList3 = new ArrayList<Order>();//用于存放不重复的元素的list
        List<Order> soleList4 = new ArrayList<Order>();//用于存放不重复的元素的list

        //利用map.containsKey()
        Map<String, Order> map = new HashMap<>();
        for(Order s : testList){
            //1:map.containsKey()   检测key是否重复
            if(map.containsKey(s.getOrderId())){
                repeatList.add(s);
            }else{
                map.put(s.getOrderId(), s);
            }

        }

        for(Order s : repeatList){
         System.out.println("存在相同的元素:" + s.toString());
      }
        System.out.println("剔除相同的元素:" );
      for(Map.Entry<String, Order> entry : map.entrySet()){
         System.out.println(entry.getValue() );
      }
//    3.提取不重复的放入另一个list 这里提供三种方式
//    方式一
            long time1=System.nanoTime();
            Set<String> set=map.keySet();
            Iterator<String> it=set.iterator();
            while(it.hasNext()) {
                soleList.add(map.get(it.next()));
            }
            long time2=System.nanoTime();

            //方式二
            Set<Entry<String, Order>> it2= map.entrySet();
            Iterator<Entry<String, Order>> entrys=it2.iterator();
            while(entrys.hasNext()) {
                Entry<String, Order> entry=entrys.next();
                soleList2.add(entry.getValue());
            }
            long time3=System.nanoTime();
            map.forEach((key,value)->{
                soleList3.add(value);
            });
            long time4=System.nanoTime();
            //方式四
            Collection<Order> collection=map.values();
            Iterator<Order> it4=collection.iterator();
            while(it4.hasNext()) {
                soleList4.add(it4.next());
            }
            long time5=System.nanoTime();

            System.out.println("keySet方法耗费时间:"+(time2-time1));
            System.out.println("entrySet方法耗费时间:"+(time3-time2));
            System.out.println("JDK8 map.forEach耗时:"+(time4-time3));
            System.out.println("map.values()耗时:"+(time5-time4));

        }catch (Exception e)
        {
            e.printStackTrace();
        }
        long end=System.currentTimeMillis();
        System.out.println("执行时长"+(end-start));
    }
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
疫情居家办公系统管理系统按照操作主体分为管理员和用户。管理员的功能包括办公设备管理、部门信息管理、字典管理、公告信息管理、请假信息管理、签到信息管理、留言管理、外出报备管理、薪资管理、用户管理、公司资料管理、管理员管理。用户的功能等。该系统采用了MySQL数据库,Java语言,Spring Boot框架等技术进行编程实现。 疫情居家办公系统管理系统可以提高疫情居家办公系统信息管理问题的解决效率,优化疫情居家办公系统信息处理流程,保证疫情居家办公系统信息数据的安全,它是一个非常可靠,非常安全的应用程序。 管理员权限操作的功能包括管理公告,管理疫情居家办公系统信息,包括外出报备管理,培训管理,签到管理,薪资管理等,可以管理公告。 外出报备管理界面,管理员在外出报备管理界面中可以对界面中显示,可以对外出报备信息的外出报备状态进行查看,可以添加新的外出报备信息等。签到管理界面,管理员在签到管理界面中查看签到种类信息,签到描述信息,新增签到信息等。公告管理界面,管理员在公告管理界面中新增公告,可以删除公告。公告类型管理界面,管理员在公告类型管理界面查看公告的工作状态,可以对公告的数据进行导出,可以添加新公告的信息,可以编辑公告信息,删除公告信息
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值