java json 占位_面试题|手写JSON解析器

这周的 Cassidoo 的每周简讯有这么一个面试题:

写一个函数,这个函数接收一个正确的 JSON 字符串并将其转化为一个对象(或字典,映射等,这取决于你选择的语言)。示例输入:fakeParseJSON('{ "data": { "fish": "cake", "array": [1,2,3], "children": [ { "something": "else" }, { "candy": "cane" }, { "sponge": "bob" } ] } } ')

当时,我想这么写:

const fakeParseJSON = JSON.parse;

但是,我想起之前写了一些关于AST的文章,

用Babel实现自定义JavaScript语法一步步教你实现一个Babel转换器使用JavaScript操作AST其中涵盖了编译器管道的概述以及如何操作AST,但是我没有过多介绍如何实现解析器。因为实现JavaScript编译器对我来说是一项艰巨的任务。

那就没必要担心。 JSON也是一种语言,有自己的语法,可以参考规范。 根据编写JSON解析器所需的知识和技术转移到编写JS解析器中。

好了,那就开始编写一个JSON解析器吧。

语法

查看规范文档页面,可以看到以下两个图。

下面的语法图(或者叫铁路图)

43a31c9eaea39dd3a1632342b060a016.png铁路图1

右侧的McKeeman Form,巴克斯-诺尔范式(BNF)的一种变体。

ff811f2c70f46a614986410f5c6e8b12.png

两个图其实是等价的。

一个基于视觉,一个基于文本。基于文本语法的语法 —— 巴科斯-诺尔范式,通常被提供给另一个解析这种语法并为其生成解析器的解析器,终于说到解析器了!

在这篇文章中,我们重点关注铁路图上,因为它是可视化的,看起来更友好。

先来看下第一张的铁路图(参见铁路图1)

所以这就是JSON中“object”的语法。

从左侧开始,沿着箭头的方向走,一直到右侧为止。

圆圈里面是一个字符,例如 {,,,:,},矩形里面是其它语法的占位符,例如 whitespace(空格)、string 和 value。因此要解析"whitespace",我们需要查阅"whitepsace"语法。

因此,对于一个对象而言,从左边开始,第一个字符必须是一个左花括号 {,然后往下走会有两种情况:

whitespace → } → 结束whitespace → string → whitespace → : → value → } → 结束当然当抵达value的时候,你可以选择继续下去:

→ } → 结束,或者→ , → whitespace → … → value你可以继续循环,直到你决定去:→ } → 结束。现在已经熟悉了铁路图,我们继续到下一节。

实现解析器

下面我们开始编写代码,代码结构如下:

69f617f4082d0e1b5e827035894aa5dd.png

初始化 i 将其作为当前字符的索引值,只要 i 值到达 str 的长度,我们就会结束函数。

后面我们来实现“object”语法:

a2e644f2a93444fefc9aa4e3b8d71301.png

我们可以调用 parseObject 来解析类似string和whitespace之类的语法,只要我们实现这些功能,一切都解决了。

还有就是我我忘记加逗号“,”了。逗号,只会出现在开始第二次whitespace → string → whitespace → : → … 循环之前。

在这个基础上,我们加上了一下几行:

9a629254b817854ea6dcf26918f4c3a6.png

一些命名上的约定:

当我们根据语法解析代码并使用返回值时,命名为parseSomething当我们期望字符在那里,但是我们没有使用字符时,命名为eatSomething当字符不存在,我们也可以接受。命名skipSomething下面来实现eatComma和eatColon

d46191d25998eced3c2960e22327502d.png

到目前为止,我们实现了parseObject的语法,但是这个解析函数的返回值是什么呢?不错,我们需要返回一个JavaScript对象:

55d212deed77251c330396044d3c6dd3.png

现在你已经看到我怎么去实现“object“语法,现在是时候让你尝试一下”array“语法了:

6a5d908b2ccef992a673f28bc3f924d0.png

c249689590a08f18af46c0d071d530b7.png

现在,我们来看一个更有趣的语法,“value”:

470c2e60fd39d6d34e078daf9b4affbf.png

如上图的路径:

一个值是以“whitespace”开始,然后接着是以下类型的一种:“string”,“number”,“object”,“array”,“true”,“false” 或者null,最后以一个“whitespace”结束。

4e00d270f9e586839bcfa8692b56581b.png

这个??叫做空值合并运算符,它类似我们用来设置默认值 foo || default 中的 ||,只要foo是假值,|| 就会返回 default, 而空值合并运算符只会在 foo 为 null 或 undefined 时返回 default。可以看个例子:

const foo = null ?? 'default string';console.log(foo);// 输出: "default string"

parseKeyword 将检查当前 str.slice(i) 是否与关键字字符串匹配,如果匹配,将返回关键字值:

89cbae39c5fbe0f77ab9115edc63f36f.png

这个就是parseKeyword的实现。

我们还有 3 个以上的语法要实现,但我为了控制文章篇幅,在下面的 CodeSandbox 中实现这些语法。

CodeSandbox完成所有语法实现之后,然后返回由parseValue返回的json值:

02f1fbd09a0d8a95af6d7f2d3892b592.png

就是这样!

好了,还没有那么快完成朋友,我们只是完成的理想的部分,那么非理想的部分呢?

处理异常输入

作为一个优秀的开发人员,我们也需要优雅地处理非理想情况。对于解析器,这意味着使用适当的错误消息大声警告开发人员。

让我们来处理两个最常见的错误情况:

Unexpected tokenUnexpected end of string在所有的 while 循环中,例如 parseObject 中的 while 循环:

c4a2405cafe1c60323861eaa9ed3beef.png

我们需要确保访问的字符不会超过字符串的长度。这发生在字符串意外结束时,而我们仍然在等待一个结束字符 —— }。比如说下面的例子:

74e30e87a73b04a3acf98cef6bee65b0.png

更好的优化

你还记得当你还是一个初级开发者的时候,每次遇到一些不清晰的语法错误的时候,你完全不知道哪里出问题了?

现在你有经验了,是时候停止这种恶性循环和吐槽了。

Unexpected token "a"

例如以上的错误,只会让用户很困惑地盯着屏幕,而不知道错误在哪里。

相比去吐槽,其实有很多更好的方式去改善这些错误提示,下面有几点建议可以考虑加到解析器里面:

错误码和标准错误信息

标准关键字对用户谷歌寻求帮助很有用

657784f9cf61344357c73a1b3d62686b.png

更好地查看哪里出问题

像 Babel 这样的解析器,会向你显示一个代码框架,它是一个带有下划线、箭头或突出显示错误的代码片段

35c6c1d232ab51b640a26a8b945e0098.png

一个如何输出代码片段的例子:

a1f6787358c6f41e5c1bbae117800efb.png

修正错误建议

可以的话,可以说明是哪里出问题以及给出修复建议。

a63f7b193fcb75add9dc09a1a48306fd.png

如果可能,根据解析器目前收集的上下文提供建议

0526ad794afa6fe389977a3bf4fa9ef0.png

基于上下文的建议会让人感觉更有关联性和可操作性。 记住所有的建议,用以下几点检查已经更新的CodeSandbox

有意义的错误消息带有错误指向失败点的代码段为错误恢复提供建议推荐阅读Evan Czaplicki的关于如何提高编译器用户体验的一篇文章“编译器错误建议”

完整代码:

51c141fc360adc8d5472d6b8d50c2548.png

b836572ce02d71a50bb3267af5216f74.png

26ff83dceb831e8ba6549a3a31897141.png

98a9b6742d1870db8099690494748e66.png

8422936509cea05a4c6b99583fc0aa69.png

3d6936170aab3a42d9946d0aada7283d.png

ec69dc3a93938b500376b98dd1d73e5b.png

1c858edc8f4e8438b00ca13746148291.png

总结

要实现解析器,你需要从语法开始。

你可以用铁路图或巴科斯-诺尔范式来使语法正式化。设计语法是最困难的一步。

一旦你解决了语法问题,就可以开始基于语法实现解析器。

错误处理很重要,更重要的是要有有意义的错误消息,以便用户知道如何修复它。

现在,你已经了解了如何实现简单的解析器,现在应该关注更复杂的解析器了:

Babel parserSvelte parser最后,请关注 @cassidoo,她的每周简讯棒极了。

(完)

以上译文仅用于学习交流,水平有限,难免有错误之处,敬请指正。如果觉得文章对你有帮助,请点个赞吧。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Java可以使用许多库来解析JSON文件,其中最常用的是Jackson和Gson。以下是使用Gson库读取和处理JSON文件的简单示例: 1. 导入Gson库 ```java import com.google.gson.*; ``` 2. 读取JSON文件 ```java // 从文件中读取JSON数据 JsonElement jsonElement = JsonParser.parseReader(new FileReader("data.json")); ``` 3. 处理JSON数据 ```java // 将JSON数据转换为JsonObject JsonObject jsonObject = jsonElement.getAsJsonObject(); // 从JsonObject中获取属性值 String name = jsonObject.get("name").getAsString(); int age = jsonObject.get("age").getAsInt(); // 获取嵌套的JsonObject JsonObject addressObject = jsonObject.getAsJsonObject("address"); String city = addressObject.get("city").getAsString(); String state = addressObject.get("state").getAsString(); // 获取JsonArray JsonArray hobbiesArray = jsonObject.getAsJsonArray("hobbies"); List<String> hobbies = new ArrayList<>(); for (JsonElement hobbyElement : hobbiesArray) { hobbies.add(hobbyElement.getAsString()); } ``` 完整示例代码: ```java import com.google.gson.*; import java.io.FileReader; import java.util.ArrayList; import java.util.List; public class JsonExample { public static void main(String[] args) throws Exception { // 从文件中读取JSON数据 JsonElement jsonElement = JsonParser.parseReader(new FileReader("data.json")); // 将JSON数据转换为JsonObject JsonObject jsonObject = jsonElement.getAsJsonObject(); // 从JsonObject中获取属性值 String name = jsonObject.get("name").getAsString(); int age = jsonObject.get("age").getAsInt(); // 获取嵌套的JsonObject JsonObject addressObject = jsonObject.getAsJsonObject("address"); String city = addressObject.get("city").getAsString(); String state = addressObject.get("state").getAsString(); // 获取JsonArray JsonArray hobbiesArray = jsonObject.getAsJsonArray("hobbies"); List<String> hobbies = new ArrayList<>(); for (JsonElement hobbyElement : hobbiesArray) { hobbies.add(hobbyElement.getAsString()); } // 输出结果 System.out.println("Name: " + name); System.out.println("Age: " + age); System.out.println("City: " + city); System.out.println("State: " + state); System.out.println("Hobbies: " + hobbies); } } ``` 其中,假设JSON文件中的内容如下: ```json { "name": "Alice", "age": 25, "address": { "city": "New York", "state": "NY" }, "hobbies": [ "reading", "painting", "hiking" ] } ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值