Fastjson源码分析—反序列化—Token的定义和解析(2)

2021SC@SDUSC
上篇分析了Token的定义和解析Token的大致过程,着重讲解了分析过程的顶层实现。这篇重点讲解底层代码,看看对json字符串进行分割时底层具体发生了什么。

skipComment()跳过注释

接上篇分析,扫描json字符串时,如果遇到’/’,将判定该段Token类型为注释,跳过这一段。

    protected void skipComment() {
        next();
        if (ch == '/') {
            for (;;) {
                next();
                if (ch == '\n') {
                    next();
                    return;
                } else if (ch == EOI) {
                    return;
                }
            }
        } else if (ch == '*') {
            next();
            for (; ch != EOI;) {
                if (ch == '*') {
                    next();
                    if (ch == '/') {
                        next();
                        return;
                    } else {
                        continue;
                    }
                }
                next();
            }
        } else {
            throw new JSONException("invalid comment");
        }
    }

简单分析一下该方法的执行流程:
首先明确,Fastjson只支持///*...*/ 形式的注释,在确定该Token为注释的前提下,若接下来的字符不符合上述两种形式,则判定为格式错误,抛出异常。
首先是读取下一个字符。
1.如果仍然遇到/,则继续读取下一个字符。如果遇到换行符,则先将指针继续往后推移一位并返回,遇到结束流则直接返回。
2.如果遇到的是*,继续读取下一个字符,看看是否是/字符。如果确实是/字符,则提前读取下一个有效字符然后终止读取。遇到非/字符,说明以下内容是注释体,继续读取直到结束。
3.若不满足上面两种情况,说明原字符串不满足json格式,抛出异常。

scanString()扫描字符串

当一个Token由"开始,说明这是一个字符串,调用底层的scanString()方法对其进行扫描。

public final void scanString() {
        np = bp;
        hasSpecial = false;
        char ch;
        for (;;) {
            ch = next();

            if (ch == '\"') {
                break;
            }

            if (ch == EOI) {
                if (!isEOF()) {
                    putChar((char) EOI);
                    continue;
                }
                throw new JSONException("unclosed string : " + ch);
            }

            if (ch == '\\') {
                if (!hasSpecial) {
                    hasSpecial = true;

                    if (sp >= sbuf.length) {
                        int newCapcity = sbuf.length * 2;
                        if (sp > newCapcity) {
                            newCapcity = sp;
                        }
                        char[] newsbuf = new char[newCapcity];
                        System.arraycopy(sbuf, 0, newsbuf, 0, sbuf.length);
                        sbuf = newsbuf;
                    }

                    copyTo(np + 1, sp, sbuf);
                    // text.getChars(np + 1, np + 1 + sp, sbuf, 0);
                    // System.arraycopy(buf, np + 1, sbuf, 0, sp);
                }

                ch = next();

                switch (ch) {//省略内部冗余代码
                }

        token = JSONToken.LITERAL_STRING;
        this.ch = next();
    }

该方法首先用np指向引号的索引,接着在for循环中读取当前字符串的字符。如果读到/,则结束读取。如果读到了结束字符EOI,但是没有遇到流的结尾,将EOI添加到结束位置。注意到方法中声明了一个bool类型变量hasSpecial,初始化为false,表明未遇到特殊符号。此时,如果扫描到\\,则将hasSpecial改为true。
sbuf为Token的缓存区,如果sp>=sbuf.length,说明缓存区空间不够,自动执行2倍扩容。接着将有效字符串复制到缓存区(省略引号)。如果没有转义字符,递增缓存区字符位置。最后自动预读下一个字符。
这个方法在处理Token中使用频率很高,理论上一个json字符串的所有Token中至少有一半为字符串,故每次反序列化都会多次调用这段代码。

其他类似方法

在这里插入图片描述

除了以上方法外,JSONLexerBase类还定义了上百种方法用于分析、处理Token。例如scanLong()用于分析long型数据,stringVal()用于获取Token包含的字符串。

总结

JSONLexerBase类位于com.alibaba.fastjson.parser,作用就是分析和处理Token。这篇博客连同上一篇已经给出了几个关键数据类型的实现,其他类型如Decimal、Float等的实现都比较简单,参考以上方法的讲解即可。这些方法的共同点都是通过获取Token的内容,然后使用分析得出的相应的类的构造方法来生成对应的对象。
分析完Token,下一步就可以开始反序列化生成Java对象了。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值