工作过程中经常会用到数组去重,用到的时候往往一时想不到好方法,所以这里来总结一下去重方法。
使用es6去重代码很简单,而且ES6已经相当普及了。所以先来介绍一下es6中的方法。
1.ES6中Map结构方法
function unique (arr) {
const seen = new Map()
return arr.filter((a) => !seen.has(a) && seen.set(a, 1))
}
let arr = [1, 2, 1, 3, '1', NaN, NaN, null, null, undefined, undefined, {}, {}];
console.log(uniMap(arr)); //[ 1, 2, 3, '1', NaN, null, undefined, {}, {} ]
Map是es6中新增的数据结构,它类似于对象,也是键值对的集合,但是“键”的范围不限于字符串,各种类型的值(包括对象)都可以当作键。也就是说,Object 结构提供了“字符串—值”的对应,Map 结构提供了“值—值”的对应,是一种更完善的 Hash 结构实现。
Map的has方法用于判断map是否含有该键。set
和get
方法分别为添加成员方法和得到键值方法。
上述方法一方面利用了map的has和set方法,一方面利用了数组的 filter方法,返回结果为真的元素组成的数组。
注意
Map 的键实际上是跟内存地址绑定的,只要内存地址不一样,就视为两个键。这句话不好理解的话,可以这样说如果 Map 的键是一个简单类型的值(数字、字符串、布尔值),则只要两个值严格相等,Map 将其视为一个键,比如0和-0就是一个键,布尔值true和字符串true则是两个不同的键, 对象是不同的键;另外,undefined和null也是两个不同的键。虽然NaN不严格相等于自身,但 Map 将其视为同一个键
2. ES6中数组Set结构方法
function uniMap (arr) {
return [...new Set(arr)];
}
let arr = [1, 2, 1, 3, '1', NaN, NaN, null, null, undefined, undefined, {}, {}];
console.log(uniMap(arr)); // [ 1, 2, 3, '1', NaN, null, undefined, {}, {} ]
Set 也是ES6 提供的新的数据结构。它类似于数组,但是成员的值都是唯一的,没有重复的值。
Set 本身是一个构造函数,用来生成Set数据结构,它也接受一个数组或具有iterator接口的数据结构作为参数初始化。上述代码中就是利用了这个特性来实现对数组的去重。
Set 具有add
方法来添加某个值,返回set结构本身。因此,利用add方法也可以实现数组的去重。例如:
const s = new Set();
function uniMap(arr) {
arr.forEach( item => s.add(item));
return [...s]; // [ 1, 2, 3, '1' ]
}
// main
let arr = [1, 2, 1, 3, '1', 2, 2, 2];
console.log(uniMap(arr));
Array.from也是ES6中的新方法可以将 Set 结构转为数组。这就引出第三种使用set的数组去重方法:
// set3
function uniMap(arr) {
return Array.from(new Set(arr));
}
let arr = [1, 2, 1, 3, '1', NaN, NaN, null, null, undefined, undefined, {}, {}];
console.log(uniMap(arr)); // [ 1, 2, 3, '1', NaN, null, undefined, {}, {} ]
注意
Set 内部判断两个值是否不同,使用的算法叫做“Same-value-zero equality”,它类似于精确相等运算符(===),所以上述结果中 1 和 '1' 认为是不相同的,都被保留下来,主要的区别是NaN等于自身,而精确相等运算符认为NaN不等于自身。另外,两个对象总是不相等的。
3. 基本双重循环
function uniMap(arr) {
let res = [];
for(let i = 0, arrLen = arr.length; i < arrLen; i += 1) {
let j = 0, resLen = res.length;
for(; j < resLen; j +=1) {
if(arr[i] === res[j]) {
break;
}
}
if( j === resLen) {
res.push(arr[i]);
}
}
return res;
}
// main
let arr = [1, 2, 1, 3, '1', 2, 2, 2];
console.log(uniMap(arr)); // [ 1, 2, 3, '1' ]
arr = [1, 2, 1, 3, '1', NaN, NaN, null, null, undefined, undefined, {}, {}];
console.log(uniMap(arr)); //[ 1, 2, 3, '1', NaN, NaN, null, undefined, {}, {} ]
我们使用循环嵌套,最外层循环 array,里面循环 res,如果 array[i] 的值跟 res[j] 的值相等,就跳出循环,如果都不等于,说明元素是唯一的,这时候 j 的值就会等于 res 的长度,根据这个特点进行判断,将值添加进 res。
这个是最基本的方法,但是第一次写还真犯了错,无法去重。代码是这样的:
function uniMap(arr) {
let res = [];
for(let i = 0, arrLen = arr.length; i < arrLen; i += 1) {
let j = 0, resLen = res.length;
for(; j < resLen; j +=1) {
if(arr[i] === res[j]) {
break;
}
res.push(arr[i]);
}
}
return res; // []
}
// main
let arr = [1, 2, 1, 3, '1', 2, 2, 2];
console.log(uniMap(arr));
和上面代码相比,就是res.push(arr[i]);放在了内循环里,少了 j === resLen的判断,就得到了空数组。原因是 初始的时候res.length = 0,不会进到内循环,所以res始终为空。果然眼高手低啊~
4. indexOf方法优化双重循环中的内部循环
// 双重循环2
function uniMap(arr) {
let res = [];
for(let i = 0, arrLen = arr.length; i < arrLen; i += 1) {
if( res.indexOf(arr[i]) === -1) {
res.push(arr[i]);
}
}
return res;
}
// main
let arr = [1, 2, 1, 3, '1', 2, 2, 2];
console.log(uniMap(arr)); // [ 1, 2, 3, '1' ]
arr = [1, 2, 1, 3, '1', NaN, NaN, null, null, undefined, undefined, {}, {}];
console.log(uniMap(arr)); // [ 1, 2, 3, '1', NaN, NaN, null, undefined, {}, {} ]
5. filter方法优化双重循环中的外层循环
// filter方法
function uniMap(arr) {
let res = [];
return res = arr.filter( (item , index) => {
return arr.indexOf(item) === index;
}) //[ 1, 2, 3, '1', null, undefined ]
}
// main
let arr = [1, 2, 1, 3, '1', NaN, NaN, null, null, undefined, undefined, {}, {}];
console.log(uniMap(arr)); // [ 1, 2, 3, '1', null, undefined, {}, {} ]
此处的filter方法可以和方法3,4排列组合用~~其实方法1也利用了filter方法(filter人气高啊)filter方法原理已经说过,忘记的往上翻~
6. Object 方法
// object
function uniMap(arr) {
let obj = {};
return arr.filter( item => {
return obj.hasOwnProperty(item) ? false : (obj[item] = true);
})
}
// main
let arr = [1, 2, 1, 3, '1', 2, 2, 2, NaN, NaN, null, null, undefined, undefined];
console.log(uniMap(arr)); // [ 1, 2, 3, NaN, null, undefined ]
上述代码原理是利用一个空的 Object 对象,我们把数组的值存成 Object 的 key 值,比如 Object[value1] = true,在判断另一个值的时候,如果 Object[value2]存在的话,就说明该值是重复的。从结果可以看到,他把数字 1 和字符串 '1'当成了同一个字符,因为对象的key值均是字符串,数字1被转换为字符串了,因此该方法适用于你想把数字和字符串去重的场合。
特殊数据结构的去重判断
去重的方法就到此结束了,然而根据上面的结果可以看到,对于特殊的数据类型比如:null、undefined、NaN、对象等,不同的去重方法其实结果是不同的。那么下面给个总结和分析。
对于例子中的这样一个数组: [1, 2, 1, 3, '1', 2, 2, 2, NaN, NaN, null, null, undefined, undefined];
方法 | 结果 | 说明 |
---|---|---|
1.Map | [ 1, 2, 3, '1', NaN, null, undefined, {}, {} ] | 对象不去重 |
2.Set | [ 1, 2, 3, '1', NaN, null, undefined, {}, {} ] | 对象不去重 |
3.双重循环 | [ 1, 2, 3, '1', NaN, NaN, null, undefined, {}, {} ] | 对象和NaN都不去重 |
4.内层index | [ 1, 2, 3, '1', NaN, NaN, null, undefined, {}, {} ] | 对象和NaN不去重 |
5.外层filter | [ 1, 2, 3, '1', null, undefined, {}, {} ] | 对象不去重NaN被忽略掉 |
6.Object方法 | [ 1, 2, 3, NaN, null, undefined ] | 数字和字符串去重,对象被忽略 |
之所以出现上面的结果,先看一下几个判断:
console.log(null === null); // true
console.log(undefined === undefined); // true
console.log(NaN === NaN); // false
console.log({} === {}); // false
再结合 indexOf 是使用 === 判断,以及set map 也使用 === 判断但是认为 NaN 和 NaN 相等,便可以分析出来。
注意
对于数组元素和去重不是上述类型和结果的,那么针对你想要的去重去灵活修改代码,不可以生搬硬套~~