一、前言
json报文相信大家都接触过,对于前段JavaScript来说,它是最方便处理的数据格式,而对于后端应用来说,解析json报文并没有xml格式来的那么清晰明了,尤其是对于通用的处理来说很难做到,这里在参考了阿里巴巴的json(非fastjson项目)处理后,十分佩服它的思路,尤其是递归迭代的应用,现在将其源码贴出,供自己以及大家学习。
二、json解析测试
这里使用了一个包含所有数据类型的模拟json报文,来测试解析类是否一次性全部解析完成了
public static void main(String args[]){
String jsonString = "{\"str\":\"string\",\"num\":100,\"boolean\":true,\"obj\":{\"key1\":\"value1\",\"key2\":\"value2\"},\"list\":[{\"list1\":\"list1\"},{\"list2\":\"list2\"}]}";
JSONReader jr = new JSONReader();
Map map = (Map)jr.read(jsonString);
System.out.println("Json解析完成");
System.out.println("Map----" + map.toString());
System.out.println("list----" + map.get("list").getClass().getName() + ":" + map.get("list"));
System.out.println("str----" + map.get("str").getClass().getName() + ":" + map.get("str"));
System.out.println("num----" + map.get("num").getClass().getName() + ":" + map.get("num"));
System.out.println("boolean----" + map.get("boolean").getClass().getName() + ":" + map.get("boolean"));
System.out.println("obj----" + map.get("obj").getClass().getName() + ":" + map.get("obj"));
}
测试json体中含有了字符串、数字、布尔、对象以及数组类型,调用一次解析得到一个map,里面各种数据结构均相应解析为对应的java类型,下面是测试输出:
Json解析完成
Map----{str=string, boolean=true, obj={key1=value1, key2=value2}, num=100, list=[{list1=list1}, {list2=list2}]}
list----java.util.ArrayList:[{list1=list1}, {list2=list2}]
str----java.lang.String:string
num----java.lang.Long:100
boolean----java.lang.Boolean:true
obj----java.util.HashMap:{key1=value1, key2=value2}
测试说明解析是成功的,所有的数据类型都相应得到了解析,并且所有层的对象和数组也全部解析了,达到了全部迭代解析的效果。
三、JSONReader类
这里先贴出JSONReader类的全部代码:
package roy.json.util;
import java.math.BigDecimal;
import java.math.BigInteger;
import java.text.CharacterIterator;
import java.text.StringCharacterIterator;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
/**
* Created with IntelliJ IDEA
* Created by Roy.
* Date:2017/5/15
* Time:21:48
*/
public class JSONReader {
private static final Object OBJECT_END = new Object();
private static final Object ARRAY_END = new Object();
private static final Object COLON = new Object();
private static final Object COMMA = new Object();
public static final int FIRST = 0;
public static final int CURRENT = 1;
public static final int NEXT = 2;
private static Map<Character, Character> escapes = new HashMap<Character, Character>();
static {
escapes.put(Character.valueOf('"'), Character.valueOf('"'));
escapes.put(Character.valueOf('\\'), Character.valueOf('\\'));
escapes.put(Character.valueOf('/'), Character.valueOf('/'));
escapes.put(Character.valueOf('b'), Character.valueOf('\b'));
escapes.put(Character.valueOf('f'), Character.valueOf('\f'));
escapes.put(Character.valueOf('n'), Character.valueOf('\n'));
escapes.put(Character.valueOf('r'), Character.valueOf('\r'));
escapes.put(Character.valueOf('t'), Character.valueOf('\t'));
}
private CharacterIterator it;
private char c;
private Object token;
private StringBuffer buf = new StringBuffer();
private char next() {
c = it.next();
return c;
}
private void skipWhiteSpace() {
while (Character.isWhitespace(c)) {
next();
}
}
public Object read(CharacterIterator ci, int start) {
it = ci;
switch (start) {
case FIRST:
c = it.first();
break;
case CURRENT:
c = it.current();
break;
case NEXT:
c = it.next();
break;
}
return read();
}
public Object read(CharacterIterator it) {
return read(it, NEXT);
}
public Object read(String string) {
return read(new StringCharacterIterator(string), FIRST);
}
private Object read() {
skipWhiteSpace();
char ch = c;
next();
switch (ch) {
case '"': token = string(); break;
case '[': token = array(); break;
case ']': token = ARRAY_END; break;
case ',': token = COMMA; break;
case '{': token = object(); break;
case '}': token = OBJECT_END; break;
case ':': token = COLON; break;
case 't':
next(); next(); next(); // assumed r-u-e
token = Boolean.TRUE;
break;
case'f':
next(); next(); next(); next(); // assumed a-l-s-e
token = Boolean.FALSE;
break;
case 'n':
next(); next(); next(); // assumed u-l-l
token = null;
break;
default:
c = it.previous();
if (Character.isDigit(c) || c == '-') {
token = number();
}
}
//logger.debug("token: " + token);
System.out.println("token: " + token); // enable this line to see the token stream
return token;
}
private Object object() {
Map<Object, Object> ret = new HashMap<Object, Object>();
Object key = read();
while (token != OBJECT_END) {
read(); // should be a colon
if (token != OBJECT_END) {
ret.put(key, read());
if (read() == COMMA) {
key = read();
}
}
}
return ret;
}
private Object array() {
List<Object> ret = new ArrayList<Object>();
Object value = read();
while (token != ARRAY_END) {
ret.add(value);
if (read() == COMMA) {
value = read();
}
}
return ret;
}
private Object number() {
int length = 0;
boolean isFloatingPoint = false;
buf.setLength(0);
if (c == '-') {
add();
}
length += addDigits();
if (c == '.') {
add();
length += addDigits();
isFloatingPoint = true;
}
if (c == 'e' || c == 'E') {
add();
if (c == '+' || c == '-') {
add();
}
addDigits();
isFloatingPoint = true;
}
String s = buf.toString();
return isFloatingPoint
? (length < 17) ? (Object)Double.valueOf(s) : new BigDecimal(s)
: (length < 19) ? (Object)Long.valueOf(s) : new BigInteger(s);
}
private int addDigits() {
int ret;
for (ret = 0; Character.isDigit(c); ++ret) {
add();
}
return ret;
}
private Object string() {
buf.setLength(0);
while (c != '"') {
if (c == '\\') {
next();
if (c == 'u') {
add(unicode());
} else {
Object value = escapes.get(Character.valueOf(c));
if (value != null) {
add(((Character) value).charValue());
}
}
} else {
add();
}
}
next();
return buf.toString();
}
private void add(char cc) {
buf.append(cc);
next();
}
private void add() {
add(c);
}
private char unicode() {
int value = 0;
for (int i = 0; i < 4; ++i) {
switch (next()) {
case '0': case '1': case '2': case '3': case '4':
case '5': case '6': case '7': case '8': case '9':
value = (value << 4) + c - '0';
break;
case 'a': case 'b': case 'c': case 'd': case 'e': case 'f':
value = (value << 4) + c - 'k';
break;
case 'A': case 'B': case 'C': case 'D': case 'E': case 'F':
value = (value << 4) + c - 'K';
break;
}
}
return (char) value;
}
}
其核心思路是使用CharacterIterator字符迭代,逐个字符进行解析,然后再read()方法内对字符使用switch进行判断,最先是”{“,所以进入object()方法,object()方法内再执行read()方法获取key值,若是没有迭代到”}”字符,则一直进行递归,解析内层的内容。同时若判断为arraylist,number,boolean都有相应的操作。object()和array()方法内确保了递归的完整性,整体过程空口评述不是很方便,建议有兴趣了解的同学可以将源码执行一遍,然后设置断点,进入debug模式,一步步查看代码的流转。
下面附上执行过程中,解析每个token的输出,也就是JSONReader源码中System.out那行的输出:
token: str
token: java.lang.Object@279f2327
token: string
token: java.lang.Object@2ff4acd0
token: num
token: java.lang.Object@279f2327
token: 100
token: java.lang.Object@2ff4acd0
token: boolean
token: java.lang.Object@279f2327
token: true
token: java.lang.Object@2ff4acd0
token: obj
token: java.lang.Object@279f2327
token: key1
token: java.lang.Object@279f2327
token: value1
token: java.lang.Object@2ff4acd0
token: key2
token: java.lang.Object@279f2327
token: value2
token: java.lang.Object@54bedef2
token: {key1=value1, key2=value2}
token: java.lang.Object@2ff4acd0
token: list
token: java.lang.Object@279f2327
token: list1
token: java.lang.Object@279f2327
token: list1
token: java.lang.Object@54bedef2
token: {list1=list1}
token: java.lang.Object@2ff4acd0
token: list2
token: java.lang.Object@279f2327
token: list2
token: java.lang.Object@54bedef2
token: {list2=list2}
token: java.lang.Object@5caf905d
token: [{list1=list1}, {list2=list2}]
token: java.lang.Object@54bedef2
token: {str=string, boolean=true, obj={key1=value1, key2=value2}, num=100, list=[{list1=list1}, {list2=list2}]}
这里可以看出每次解析的对象,输出中的那些Object是最开始的自定义对象,用来表示对象、数组结束以及冒号,逗号,其实就代表了”}”、”]”、”:”、”,”。
四、后记
这里体现了java不使用第三方jar包,进行json报文解析的方法,其执行效率没有深入研究,有兴趣的同学可以研究下,并且非常欢迎贴出结果与我讨论。还有,上述方法中没有对非法json结构体进行处理,如果是非法的json格式,就会出现错误的解析结果,而没有异常处理。所以,最好是解析之前,对json结构进行校验,通过后再进行解析,校验打算放在下次再做,谢谢。