JSON是JavaScript的一个严格的子集,利用了JavaScript中的一些模式来表示结构化数据。关于JSON,最重要的是要理解它是一种数据格式,不是一种编程语言。
语法
JSON的语法可以表示以下三种类型的值。
简单值:使用与JavaScript相同的语法,可以在JSON中表示字符串、数值、布尔值和null。但JSON不支持JavaScript中的特殊值undefined。
对象:对象作为一种复杂数据类型,表示的是一组无序的键值对儿。而每个键值对儿中的值可以是简单值,也可以是复杂数据类型的值。
数组:数组也是一种复杂数据类型,表示一组有序的值的列表,可以通过数值索引来访问其中的值。数组的值也可以是任意类型—简单值、对象和数组。
JSON不支持变量、函数或对象实例,它就是一种表示结构化数据的格式,虽然与JavaScript中表示数据的某些语法相同,但它并不局限JavaScript的范畴。
简单值
最简单的JSON数据形式就是简单值。例如,下面这个值是有效的JSON数据:
5
这是JSON表示数值5的方式。类似地,下面是JSON表示字符地方式:
"Hello world!"
JavaScript字符串与JSON字符串的最大区别在于,JSON字符串必须使用双引号(单引号会导致语法错误)。
布尔值和null也是有效的JSON形式。但是,在实际应用中,JSON更多地用来表示更复杂地数据结构,而简单值只是整个数据结构中的一部分。
对象
JSON中的对象与JavaScript字面量稍微有一些不同。下面是一个JavaScript中的对象字面量:
var person = {
name:"Nicholas",
age:29
};
这虽然是开发人员在JavaScript中创建对象字面量的标准方式,但JSON中的对象要求给属性加引号。实际上,在JavaScript中,前面的字面量完全可以写成下面这样:
var object = {
"name":"Nicholas",
"age":29
}
JSON表示上述对象的方式如下:
{
"name":"Nicholas",
"age":29
}
与JavaScript的对象字面量相比,JSON对象有两个地方不一样。首先,没有声明变量(JSON中没有变量的概念。)其次,没有末尾的分号(因为这不是JavaScript语句,所以不需要分号)。再说一遍,对象的属性必须加双引号,这在JSON中是必须的。属性的值可以是简单值,也可以是复杂类型值,因此可以像下面这样在对象中嵌入对象:
{
"name":"Nicholas",
"age":29,
"school": {
"name":"Merrimack College",
"location":"North Andover,MA"
}
}
这个例子在顶级对象中嵌入了学校(“school”)信息。虽然有两个”name”属性,但由于它们分别属于不同的对象,因此这样完全没有问题。不过,同一个对象中绝对不应该出现两个同名属性。
与JavaScript不同,JSON中对象的属性名任何时候都必须加双引号。手工编写JSON时,忘了给对象属性名加双引号或者把双引号写成单引号都是常见的错误。
数组
JSON中的第二种复杂数据类型是数组。JSON数组采用的就是JavaScript中的数组字面量形式。例如,下面是JavaScript中的数组字面量:
var values = [25,"hi",true];
在JSON中,可以采用同样的语法表示同一个数组:
[25,"hi",true]
同样要注意,JSON数组也没有变量和分号。把数组和对象结合起来,可以构成更复杂的数据集合。
对象和数组通常是JSON数据格式的最外层形式(当然,这不是强制规定的),利用它们能够创造出各种各样的数据结构。
解析与序列化
JSON对象
早期的JSON解析器基本上就是eval()函数。由于JavaScript语法的子集,因此eval()函数可以解析、解释并返回JavaScript对象和数组。ECMAScript5对解析JSON的行为进行规范,定义了全局对象JSON。使用eval()对JSON数据结构求值存在风险,因为可能会执行一些恶意代码。
JSON对象有两个方法:stringify()和parse()。在最简单的情况下,这两个方法分别用于把JavaScript对象序列化为JSON字符串和把JSON字符串解析为原生JavaScript值。例如
var book = {
title:"Professional JavaScript",
authors:[
"Nicholas C.Zakas"
],
edition:3,
year:2011
};
var jsonText = JSON.stringify(book);
这个例子使用JSON.stringify()把一个JavaScript对象序列化为一个JSON字符串,然后将它保存在变量jsonText中。默认情况下,JSON.stringify()输出的JSON字符串不包含任何空格字符或缩进,因此保存在jsonText中的字符串如下所示:
{"title":"Professional","authors":["Nicholas C.Zakas"],"edition":3}
在序列化JavaScript对象时,所有函数及原型成员都会被有意忽略,不体现在结果中。此外,值为undefined的任何属性也都会被跳过。结果中最终都是值为有效的JSON数据类型的实例属性。
将JSON字符串直接传递给JSON.parse()就可以得到相应的JavaScript值。例如,使用下列代码就可以创建与book类似的对象:
var bookCopy = JSON.parse(jsonText);
注意,虽然book与bookCopy具有相同的属性,但它们是两个独立的、没有任何关系的对象。
如果传给JSON.parse()的字符串不是有效的JSON,该方法会抛出错误。
序列化选项
实际上,JSON.stringify()除了要序列化的JavaScript对象外,还可以接受另外两个参数,这两个参数用于指定以不同的方式序列化JavaScript对象。第一个参数是个过滤器,可以是一个数组,也可以是一个函数;第二个参数是一个选项,表示是否在JSON字符串中保留缩进。单独或组合使用这两个参数,可以更全面深入地控制JSON的序列化。
1.过滤结果
如果过滤器是数组,那么JSON.stringify()的结果中将只包含数组中列出的属性。来看下面的例子。
var book = {
"title":"Professional JavaScript",
"authors":[
"Nicholas C. Zakas"
],
edition:3,
year:2011
};
var jsonText = JSON.stringify(book,["title","edition");
JSON的第二个参数是一个数组,其中包含两个字符串:”title”和”edition”。这两个属性与将要序列化的对象中的属性是对应的,因此在返回的结果字符串中,就会包含这两个属性:
{"title":"Professional JavaScript","edition":3}
如果第二个参数是函数,行为会稍有不同。传入的函数接收两个参数,属性(键)名和属性值。根据属性(键)名可以知道应该如何处理要序列化的对象中的属性。属性名只能是字符串,而在值并非键值对儿结构的值时,键名可以是空字符串。
为了改变序列化对象的结果,函数返回的值就是相应键的值。不过要注意,如果函数返回了undefined,那么相应的属性会被忽略。还是看一个例子吧
var book = {
title:"Professional JavaScript",
author:[
"Nicholas C. Zakas",
],
editor:3,
year:2011
};
var jsonText = JSON.stringify(book,function(key,value) {
switch(key) {
case "authors":
return value.join(",");
case "year":
return 5000;
case "edition":
return undefined;
default:
return value;
}
});
这里函数过滤器根据传入的键来决定结果。如果键为”authors”,就将数组连接为一个字符串;如果键为”year”,则将其值设置为5000;如果键为”edition”,通过返回undefined删除该属性。最后,一定要提供default项,此时返回传入的值,以便其他值都能正常出现在结果中。实际上,第一次调用这个函数过滤器,传入的键是一个空字符串,而值就是book对象。序列化后的JSON字符串如下所示:
{”title":"Professional JavaScript","authors":"Nicholas C. Zakas","year":5000}
2.字符串缩进
JSON.stringify()方法的第三个参数用于控制结果中的缩进和空白符。如果这个参数是一个数值,那它表示的是每一个级别缩进的空格数。例如,要在每个级别缩进4个空格,可以这样写代码:
var book = {
title:"Professional JavaScript",
authors:[
"Nicholas C. Zakas"
],
edition:3,
year:2011
};
var jsonText = JSON.stringify(book,null,4);
保存在jsonText中的字符串如下所示:
{
“title":"Professional JavaScript",
"authors":[
"Nicholas C. Zakas"
],
"edition":3,
"year":2011
}
不知道读者注意到没有,JSON.stringify()也在结果字符串中插入了换行符以提高可读性。只要传入有效的控制缩进的参数值,结果字符串就会包含换行符。(只缩进而不换行意义不大)最大缩进空格数为10,所有大于10的值都会自动转换为10。
如果缩进参数是一个字符串而非数值,则这个字符串将在JSON字符串中被用做缩进字符(不再使用空格)。在使用字符串的情况下,可以将缩进字符设置为制表符,或者两个短划线之类的任意字符。
var jsonText = JSON.stringify(book,null,"--");
这样,jsonText中的字符串将变成如下所示:
{
--"title":"Professional JavaScript",
--"authors":[
----"Nicholas C. Zakas"
--],
--"edition":3,
--"year":2011
}
3.toJSON()方法
有时候,JSON.stringify()还是不能满足对某些对象进行自定义序列化的需求。在这些情况下,可以给对象定义toJSON()方法,返回其自身的JSON数据格式。原生Date对象有一个toJSON()方法,能够将JavaScript的Date对象自动转换成ISO 8601日期字符串(与在Date对象上调用toISOString()的结果完全一样)。
可以为任何对象添加toJSON()方法,比如:
var book = {
title:"Professional JavaScript",
authors:[
"Nicholas C. Zakas"
],
edition:3,
year:2011,
toJSON:function() {
return this.title;
}
}
var jsonText = JSON.stringify(book);
以上代码在book对象上定义了一个toJSON()方法,该方法返回图书的书名。与Date对象类似,这个对象也将被序列化为一个简单的字符串而非对象。可以让toJSON()方法返回任何值,它都能正常工作。比如。可以让这个方法返回undefined,此时如果包含它的对象嵌入在另一个对象中,会导致它的值变成null,而如果它是顶级对象,结果就是undefined。
toJSON()可以作为函数过滤器的补充,因此理解序列化的内部顺序十分重要。假设把一个对象传入JSON.stringify(),序列化对象的顺序如下:
- 如果存在toJSON()方法而且能够通过它取得有效的值,则调用该方法。否则,返回对象本身。
- 如果提供了第二个参数,应用这个函数过滤器。传入函数过滤器的值是第1步返回的值。
- 对第2步返回的每个值进行相应的序列化。
- 如果提供了第三个参数,执行相应的格式化。
无论是考虑定义toJSON()方法,还是考虑使用函数过滤器,亦或需要同时使用两者,理解这个顺序都是至关重要的。
解析选项
JSON.parse()方法也可以接受另一个参数,该参数是一个函数,将在每个键值对儿上调用。为了区别JSON.stringify()接收的过滤函数,这个函数被称为还原函数,但实际上这两个函数的签名是相同的–它们都接收两个参数,一个键和一个值,而且都需要返回一个值。
如果还原函数返回undefined,则表示要从结果中删除相应的键;如果返回其他值,则将该值插入到结果中。在将日期字符串转换为Date对象时,经常要用到还原函数。例如:
var books = {
title:"Professional JavaScript",
authors:[
"Nicholas C. Zakas"
],
edition:3,
year:2011,
releaseDate:new Date(2011,11,1)
};
var jsonText = JSON.stringify(book);
var bookCopy = JSON.parse(jsonText,function(key,value){
if (key == "releaseDate"){
return new Date(value);
} else {
return value;
}
});
console.log(bookCopy.releaseDate.getFullYear());