Java一次性递归解析json报文为Map(不使用第三方jar包)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Roy_70/article/details/72231110

一、前言

json报文相信大家都接触过,对于前段JavaScript来说,它是最方便处理的数据格式,而对于后端应用来说,解析json报文并没有xml格式来的那么清晰明了,尤其是对于通用的处理来说很难做到,这里在参考了阿里巴巴的json(非fastjson项目)处理后,十分佩服它的思路,尤其是递归迭代的应用,现在将其源码贴出,供自己以及大家学习。

二、json解析测试

这里使用了一个包含所有数据类型的模拟json报文,来测试解析类是否一次性全部解析完成了

public static void main(String args[]){
        String jsonString = "{\"str\":\"string\",\"num\":100,\"boolean\":true,\"obj\":{\"key1\":\"value1\",\"key2\":\"value2\"},\"list\":[{\"list1\":\"list1\"},{\"list2\":\"list2\"}]}";
        JSONReader jr = new JSONReader();
        Map map = (Map)jr.read(jsonString);
        System.out.println("Json解析完成");
        System.out.println("Map----" + map.toString());
        System.out.println("list----" + map.get("list").getClass().getName() + ":" + map.get("list"));
        System.out.println("str----" + map.get("str").getClass().getName() + ":" + map.get("str"));
        System.out.println("num----" + map.get("num").getClass().getName() + ":" + map.get("num"));
        System.out.println("boolean----" + map.get("boolean").getClass().getName() + ":" + map.get("boolean"));
        System.out.println("obj----" + map.get("obj").getClass().getName() + ":" + map.get("obj"));
    }

测试json体中含有了字符串、数字、布尔、对象以及数组类型,调用一次解析得到一个map,里面各种数据结构均相应解析为对应的java类型,下面是测试输出:

Json解析完成
Map----{str=string, boolean=true, obj={key1=value1, key2=value2}, num=100, list=[{list1=list1}, {list2=list2}]}
list----java.util.ArrayList:[{list1=list1}, {list2=list2}]
str----java.lang.String:string
num----java.lang.Long:100
boolean----java.lang.Boolean:true
obj----java.util.HashMap:{key1=value1, key2=value2}

测试说明解析是成功的,所有的数据类型都相应得到了解析,并且所有层的对象和数组也全部解析了,达到了全部迭代解析的效果。

三、JSONReader类

这里先贴出JSONReader类的全部代码:

package roy.json.util;

import java.math.BigDecimal;
import java.math.BigInteger;
import java.text.CharacterIterator;
import java.text.StringCharacterIterator;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

/**
 * Created with IntelliJ IDEA
 * Created by Roy.
 * Date:2017/5/15
 * Time:21:48
 */
public class JSONReader {
    private static final Object OBJECT_END = new Object();
    private static final Object ARRAY_END = new Object();
    private static final Object COLON = new Object();
    private static final Object COMMA = new Object();
    public static final int FIRST = 0;
    public static final int CURRENT = 1;
    public static final int NEXT = 2;

    private static Map<Character, Character> escapes = new HashMap<Character, Character>();
    static {
        escapes.put(Character.valueOf('"'), Character.valueOf('"'));
        escapes.put(Character.valueOf('\\'), Character.valueOf('\\'));
        escapes.put(Character.valueOf('/'), Character.valueOf('/'));
        escapes.put(Character.valueOf('b'), Character.valueOf('\b'));
        escapes.put(Character.valueOf('f'), Character.valueOf('\f'));
        escapes.put(Character.valueOf('n'), Character.valueOf('\n'));
        escapes.put(Character.valueOf('r'), Character.valueOf('\r'));
        escapes.put(Character.valueOf('t'), Character.valueOf('\t'));
    }

    private CharacterIterator it;
    private char c;
    private Object token;
    private StringBuffer buf = new StringBuffer();

    private char next() {
        c = it.next();
        return c;
    }

    private void skipWhiteSpace() {
        while (Character.isWhitespace(c)) {
            next();
        }
    }

    public Object read(CharacterIterator ci, int start) {
        it = ci;
        switch (start) {
            case FIRST:
                c = it.first();
                break;
            case CURRENT:
                c = it.current();
                break;
            case NEXT:
                c = it.next();
                break;
        }
        return read();
    }

    public Object read(CharacterIterator it) {
        return read(it, NEXT);
    }

    public Object read(String string) {
        return read(new StringCharacterIterator(string), FIRST);
    }

    private Object read() {
        skipWhiteSpace();
        char ch = c;
        next();
        switch (ch) {
            case '"': token = string(); break;
            case '[': token = array(); break;
            case ']': token = ARRAY_END; break;
            case ',': token = COMMA; break;
            case '{': token = object(); break;
            case '}': token = OBJECT_END; break;
            case ':': token = COLON; break;
            case 't':
                next(); next(); next(); // assumed r-u-e
                token = Boolean.TRUE;
                break;
            case'f':
                next(); next(); next(); next(); // assumed a-l-s-e
                token = Boolean.FALSE;
                break;
            case 'n':
                next(); next(); next(); // assumed u-l-l
                token = null;
                break;
            default:
                c = it.previous();
                if (Character.isDigit(c) || c == '-') {
                    token = number();
                }
        }
        //logger.debug("token: " + token);
        System.out.println("token: " + token); // enable this line to see the token stream
        return token;
    }

    private Object object() {
        Map<Object, Object> ret = new HashMap<Object, Object>();
        Object key = read();
        while (token != OBJECT_END) {
            read(); // should be a colon
            if (token != OBJECT_END) {
                ret.put(key, read());
                if (read() == COMMA) {
                    key = read();
                }
            }
        }

        return ret;
    }

    private Object array() {
        List<Object> ret = new ArrayList<Object>();
        Object value = read();
        while (token != ARRAY_END) {
            ret.add(value);
            if (read() == COMMA) {
                value = read();
            }
        }
        return ret;
    }

    private Object number() {
        int length = 0;
        boolean isFloatingPoint = false;
        buf.setLength(0);

        if (c == '-') {
            add();
        }
        length += addDigits();
        if (c == '.') {
            add();
            length += addDigits();
            isFloatingPoint = true;
        }
        if (c == 'e' || c == 'E') {
            add();
            if (c == '+' || c == '-') {
                add();
            }
            addDigits();
            isFloatingPoint = true;
        }

        String s = buf.toString();
        return isFloatingPoint
                ? (length < 17) ? (Object)Double.valueOf(s) : new BigDecimal(s)
                : (length < 19) ? (Object)Long.valueOf(s) : new BigInteger(s);
    }

    private int addDigits() {
        int ret;
        for (ret = 0; Character.isDigit(c); ++ret) {
            add();
        }
        return ret;
    }

    private Object string() {
        buf.setLength(0);
        while (c != '"') {
            if (c == '\\') {
                next();
                if (c == 'u') {
                    add(unicode());
                } else {
                    Object value = escapes.get(Character.valueOf(c));
                    if (value != null) {
                        add(((Character) value).charValue());
                    }
                }
            } else {
                add();
            }
        }
        next();

        return buf.toString();
    }

    private void add(char cc) {
        buf.append(cc);
        next();
    }

    private void add() {
        add(c);
    }

    private char unicode() {
        int value = 0;
        for (int i = 0; i < 4; ++i) {
            switch (next()) {
                case '0': case '1': case '2': case '3': case '4':
                case '5': case '6': case '7': case '8': case '9':
                    value = (value << 4) + c - '0';
                    break;
                case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':
                    value = (value << 4) + c - 'k';
                    break;
                case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':
                    value = (value << 4) + c - 'K';
                    break;
            }
        }
        return (char) value;
    }
}

其核心思路是使用CharacterIterator字符迭代,逐个字符进行解析,然后再read()方法内对字符使用switch进行判断,最先是”{“,所以进入object()方法,object()方法内再执行read()方法获取key值,若是没有迭代到”}”字符,则一直进行递归,解析内层的内容。同时若判断为arraylist,number,boolean都有相应的操作。object()和array()方法内确保了递归的完整性,整体过程空口评述不是很方便,建议有兴趣了解的同学可以将源码执行一遍,然后设置断点,进入debug模式,一步步查看代码的流转。
下面附上执行过程中,解析每个token的输出,也就是JSONReader源码中System.out那行的输出:

token: str
token: java.lang.Object@279f2327
token: string
token: java.lang.Object@2ff4acd0
token: num
token: java.lang.Object@279f2327
token: 100
token: java.lang.Object@2ff4acd0
token: boolean
token: java.lang.Object@279f2327
token: true
token: java.lang.Object@2ff4acd0
token: obj
token: java.lang.Object@279f2327
token: key1
token: java.lang.Object@279f2327
token: value1
token: java.lang.Object@2ff4acd0
token: key2
token: java.lang.Object@279f2327
token: value2
token: java.lang.Object@54bedef2
token: {key1=value1, key2=value2}
token: java.lang.Object@2ff4acd0
token: list
token: java.lang.Object@279f2327
token: list1
token: java.lang.Object@279f2327
token: list1
token: java.lang.Object@54bedef2
token: {list1=list1}
token: java.lang.Object@2ff4acd0
token: list2
token: java.lang.Object@279f2327
token: list2
token: java.lang.Object@54bedef2
token: {list2=list2}
token: java.lang.Object@5caf905d
token: [{list1=list1}, {list2=list2}]
token: java.lang.Object@54bedef2
token: {str=string, boolean=true, obj={key1=value1, key2=value2}, num=100, list=[{list1=list1}, {list2=list2}]}

这里可以看出每次解析的对象,输出中的那些Object是最开始的自定义对象,用来表示对象、数组结束以及冒号,逗号,其实就代表了”}”、”]”、”:”、”,”。

四、后记

这里体现了java不使用第三方jar包,进行json报文解析的方法,其执行效率没有深入研究,有兴趣的同学可以研究下,并且非常欢迎贴出结果与我讨论。还有,上述方法中没有对非法json结构体进行处理,如果是非法的json格式,就会出现错误的解析结果,而没有异常处理。所以,最好是解析之前,对json结构进行校验,通过后再进行解析,校验打算放在下次再做,谢谢。

展开阅读全文

没有更多推荐了,返回首页