稀疏数组真心话大冒险

An adventure in sparse arrays
JavaScript 稀疏数组与孔(hole) - 简书

概念

稀疏数组(sparse array)

稀疏数组与密集数组最大的不同,就是稀疏数组中可以有“孔”(hole)。 绝大多数 JavaScript 中的稀疏数组默认是都带孔的。(ES标准并没有这样规定)

孔(hole)

孔是逻辑上存在于数组中,但物理上不存在与内存中的那些数组项。在那些仅有少部分项被使用的数组中,孔可以大大减少内存空间的浪费。 孔更像是 undefined ,但并非真正的没有被定义,仅仅是数组中的孔没有被赋值。

简单实现(大冒险)

new Array(1) // hole × 1
[ , ] // hole × 1
[ 1, ] // int(1), no holes, length: 1
[ 1, , ] // int(1) and hole × 1
复制代码

上例中可以看出,数组逗号分隔符后边的元素完全被忽略了。

再看看容易混淆的情况:

const a = [ undefined, , ];
console.log(a[0]) // undefined
console.log(a[1]) // undefined
复制代码

以上数组的值都为 undefined ,但是又并非都为 undefined。可以看出,a[0] 的值是 undefineda[1] 是一个孔。

我们用 prop in object 验证一下

const a = [ undefined, , ];
console.log(0 in a) // true
console.log(1 in a) // false
复制代码

这样看起来是不是很明朗了?但是真正的孔为 undefined 的真相是什么,我们继续。 使用原型链 prototype 进行一次赋值,来看看情况:

// elsewhere in boobooland
Array.prototype[1] = 'fool!'
// and in my code
const a = [ undefined, , ];
console.log(0 in a) // true
console.log(1 in a) // true … ?
复制代码

那问题来了,如果原型链被污染了,这种方式验证孔的存在就显得不严谨了。当然使用 proper 的方式可以避免这种情况:

// elsewhere in boobooland
Array.prototype[1] = 'fool!'
// and in my code
const a = [ undefined, , ];
console.log(a.hasOwnProperty(1)) // false
// ? have some of that boobooland
复制代码

自从 hasOwnPropertyES3 提出后,使用这个方法,我们可以称自己是一个 古典编程者。?

为什么(真心话)

性能可以作为阐述孔的存在的原因,比如创建一个数组 new Array(10000000),这里并没有 1 千万的值被分配在数组中,浏览器也不会存储任何数据。

在遍历中终止

我们验证一下在 mapforEachfilter 这3种遍历模式下的回调情况。

forEach 将跳过所有的孔,也会耗时。

const a = new Array(100)
a[1] = 1
let i = 0
a.forEach(() => i++)
console.log(i) // 1 - the callback is never called
复制代码

mapforEach 一样,跳过所有孔,但是也会在结果中 return 对应的孔。

const a = [ undefined, , true ];
const res = a.map(v => typeof v);
console.log(res) // [ "undefined", hole × 1, "boolean" ]
复制代码

当然,全是孔的数组使用 map return 固定值,也不好使,仍然会 return 一个孔,对应的回调函数并不执行。

new Array(10).map((_, i) => i + 1) // hole × 10
// not 1, 2, 3 … etc ?
复制代码

然后,filter 会移除对应的孔。

const a = [ undefined, , true ];
const res = a.filter(() => true);
console.log(res) // [ undefined, true ] - no hole ?
复制代码

在循环中进行

有两种循环可以遨游稀疏数组,第一种是经典的循环,for,当然,whiledo/while一样起作用。

const a = new Array(3);
for (let i = 0; i < a.length; i++) {
  console.log(i, a[i]) // logs 0…2 + undefined
}
复制代码

另外,ES6 的数组方法,会将数组的孔转换为 undefined,这是因为在底层,数组展开使用了 iterator 协议

这意味着在如果要拷贝数组的时候,需要谨慎使用 ... 扩展运算,而使用 slice 方法拷贝。

const a = [ 1, , ];
const b = [ ...a ];
const c = a.slice();

expect(a).toEqual(b); // false
expect(a).toEqual(c); // true
复制代码

适用于稀疏数组的情况

对比一下 Array.from({ length }) 的情况,可以看出耗时差距。

const length = 1000000; // 1 million ?
let time = new Date().getTime()
new Array(length); // ~5ms
console.log(new Date().getTime() - time)
time = new Date().getTime()
Array.from({ length }) // ~150ms
console.log(new Date().getTime() - time)
复制代码

总结

  • 分隔符尾部元素会被忽略
[ 1, 2, 3, ] // no hole at the end, just a regular trailing comma
复制代码
  • 分隔符中间为孔
[ 1, , 2 ] // hole at index(1) aka empty
复制代码
  • 检测孔使用 array.hasOwnProperty(index)
[ 1, , 2 ].hasOwnProperty(1) // false: index(1) does not exist, thus a hole
复制代码
  • 遍历方法,如 mapforEachevery 不会回调孔
const a = new Array(1000);
let ctr = 0;
a.forEach(() => ctr++);
console.log(ctr); // 0 - the callback was never called
复制代码
  • map 返回的新数组会包含对应的孔
[ 1, , 2 ].map(x => x * x) // [ 1, <empty>, 4 ]
复制代码
  • filter 返回的数组会移除孔
[ 1, , 2 ].filter(x => true) // [ 1, 2 ]
复制代码
  • keysvalues 返回的循环方法会遍历到孔,包含但不限于 for key of array.keys())
const a = [ 'a', , 'b' ];
for (let [index, value] of a.entries()) {
  console.log(index, value);
}
/* logs:
- 0 'a'
- 1 undefined
- 2 'b'
*/
复制代码
  • 数组展开运算 [...array] 会转换孔为 undefined,这当然会增加内存消耗,影响性能
[...[ 'a', , 'b' ]] // ['a', undefined, 'b']
复制代码
  • 庞大的数据创建非常迅速,比 Array.from 快多了
const length = 10000000; // 10 million
new Array(length); // quick
Array.from({ length }) // less quick
复制代码
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值