一、前言
首先这里说的原始选择器是指除 querySelector 、 querySelectorAll 外的其他选择器。从前我只使用 getElementById 获取元素并没有觉得有什么问题,但随着参与项目的前端规模逐步扩大,踩的坑就越来越多,于是将踩过的和学习过的经验教训记录在这里,供以后好查阅。
二、HTMLDocument和HTMLElement下的常规选择器
1. HTMLDocument的选择器: getElementById 、 getElementsByName 、 getElementsByTagName、 getElementsByClassName
2. HTMLElement的选择器: getElementsByTagName 、 getElementsByClassName
三、被遗忘的小伙伴getElementsByClassName
对于像我这样被专注于管理类后台系统开发的伪前端码农来说, getElementsByClassName 确实是见都没见过,因为IE5678原生就不支持它。但从命名可知其功能就是,它是通过类名选择元素。那么我们就可以polyfill一下了。
document.getElementsByClassName = function(cls){
var r = new RegExp('\\b' + cls + '\\b', 'i');
var seed = document.all, i = 0, nodes = [], node;
while (node = seed[i++]){
if (node.nodeType === 1){
node.className.search(r) >= 0 && nodes.push(node);
}
}
return nodes;
};
注意:上述的polyfill仅仅是表面填补泥而已,返回的为节点数组并非HTMLCollection类型对象,因此缺失只读、实时同步、item和namedItem等特性。
四、IE567下getElementById的诡异行为
通过望文生义,getElementById理应只返回id属性值匹配的元素,而IE8+、webkit和molliza也是这样做的。但IE567却不遵循这一法则,它们会获取id属性值或name属性值匹配的元素,然后以第一个匹配的元素作为返回值。
示例:
html
<span name="dummy"></span>
<div id="dummy"></div>
javascript
var node = document.getElementById("dummy");
// IE8+、Webkit和Molliza下均显示div
// IE567下显示span
console.log(node.tagName.toLocaleLowerCase());
针对上述IE的bug我们可以进行简单的修复
var nativeGetById = document.getElementById;
document.getElementById = function(id){
var node = nativeGetById.call(this, id);
if (node && node.id !== id){
var nodes = document.all[id];
var i = 0;
for (;(node = nodes && nodes[i++] || null, node && node.id !== id);){}
// 上面的for循环是把玩语法而已,效果和下面的一样
// if (!nodes) return null;
// for (var len = nodes.length; i < len; ++i){
// node = nodes[i];
// if (node && node.id === id) break;
// }
}
return node;
};
五、IE56789下getElementsByName的怪异行为
经踩坑发现在IE56789下使无法通过getElementsByName来获取table、td、th、tr、tbody、thead、tfoot的 对象引用,查阅W3C表示这些元素的固有属性本来就没有name,所以最初认为IE这一行为是正确的。但经过试验发现同样没有name固有属性的 colgroup、caption和col却能通过getElementsByName获取,于是开始头大了。然后转向IE10+、Webkit和 Molliza进行同样的测试,均可成功获取,于是判断这是IE56789的怪异行为。
发现这一问题后我想到的是对IE56789下getElementsByName的返回值进行加工,将name属性值匹配的table、td、th、 tr、tbody、thead和tfoot对象都加上去,虽然这样就解决了对象缺失的问题,但又引入了新的问题,那就是 getElementsByName的返回值不再是HTMLCollection类型,因此失去了与文档节点信息实时同步、只读、item成员方法、 namedItem成员方法的特性。
失去得显然比得到的少,于是我决定不修复这一怪异行为。
六、无法更改执行上下文的this引用?
自从知道 Function.prototype.call、Function.prototype.apply和Fucntion.prototype.bind 后,锁定执行上下文(EC)的this引用变得十分的简单(具体的polyfill可浏览《一起Polyfill系统:Function.prototype.bind的四个阶段》)。但倘若你想通过锁定getElementById、getElementsByName的this引用,从而达到选择根节点的动态变换,那将掉进另一个坑中。
错误的示例:
// 下面的代码将会抛异常
var nativeGetId = document.getElementById;
var a = document.getElementsByTagName('a')[0];
nativeGetId.call(a, 'innerImg');
根据现象推测,getElementId内部实现可能是针对特定的DOM对象而工作的,所以当强行改变this引用时,就会跑异常。
七、IE5678下选择器的原型链上少了Function?
也许你看到这个标题的时候会认为这是不可能的事,因为 document.getElementById.call 是真实存在的呀。但 document.getElementById instanceof Function 居然返回false,现在头大了吧。让我们再通过下面对Function原型增强来验证一下吧!
Function.prototype.just4Test = function(){
console.log('just4Test');
};
console.log(typeof document.getElementById.just4Test); // 返回undefined
事实证明IE5678下选择器的原型链没有Function,那选择器就无法共享各种对Function原型的增强了,所以我们需要通过一层薄薄的封装来处理。
// 以getElementsByName为例
var nativeGetByName = document.getElementsByName;
document.getElementsByName = function(name){
return nativeGetByName.call(this, name);
};
八、IE独创的选择器
上面说到的选择器是各大浏览器厂商都支持,而IE独创的选择器我想大家都会想到是 document.all ,但这个类函数水可不浅,下面让我们来踩一下吧!
// IE5678下,获取NodeList,但在IE567中通过Object.prototype.toString.call()获取内部类型时,返回的是[object Object]
document.all[`id或name`];
// IE5678下,获取的是指定索引值的元素HTMLElement通过Object.prototype.toString.call()获取内部类型时,返回的是[object Object]
document.all[{Number} 索引];
document.all(); // 获取第一个元素(指定索引值的元素)
document.all({Number} 索引); // 获取第一个元素(指定索引值的元素)
// IE567下,获取id属性值或name属性值匹配的所有元素,返回一个有函数功能的[object Object]对象
document.all({String} id或name);
document.all({String} id或name, {Number} 索引); // 获取HTMLElement
document.all({String} id或name)({Number} 索引); // 获取HTMLElement
// IE8下,获取的是第一个匹配的元素HTMLElement通过Object.prototype.toString.call()获取内部类型时,返回的是[object Object]
document.all({String} id或name);
document.all({String} id或name, 索引); // 抛异常
// IE5678,通过标签名获取匹配的所有元素,返回一个有函数功能的[objectg Object]对象
document.all.tags({String} tag);
document.all.tags({String} tag)({Number} 索引);
document.all.tags({String} tag)[{Number} 索引];
// IE5678,获取指定位置的元素(HTMLElement)
document.all.item(); // 获取第一个元素
document.all.item({Number} 索引);
// IE567,获取id属性值或name属性值匹配的所有元素,返回一个有函数功能的[object Object]对象
document.all.item({String} id或name);
// IE567,返回元素(HTMLElement)
document.all.item({String} id或name, {Number} 索引);
document.all.item({String} id或name)({Number} 索引);
document.all.item({String} id或name)[{Number} 索引];
// IE8+,只返回第一个元素
document.all.item({String} id或name);
// IE8+,只返回一个HTMLCommentElement对象
document.all.item({String} id或name, {Number} 索引);
document.all.item({String} id或name)({Number} 索引);
document.all.item({String} id或name)[{Number} 索引];
总结一句,若要使用那就使用 document.all[{String} id或name] 就好了(其他返回的是正常的NodeList嘛),其它用法能不用就坚决不用吧。
另外,除了document拥有all属性外,其实直接继承Node类型的都拥有all属性,也就是说素有DOM对象均有all属性用于获取其所有子节点。
0级DOM武士刀
0级DOM:在W3C标准DOM起草前,由网景公司定义的节点操控API,并后来作为W3C标准的0级DOM规范。
九、隐藏的武士刀一: document.forms
无论是在w3c还是其他渠道查阅都被告知该函数用于获取页面上所有form元素,当然这点说得一点都没有错,但不够深入。那么如何深入呢?那么就要从form的嵌套入手了。
html:
<form name="outer" id="outer">
<input type="text" name="outerInput"/>
<form name="inner" id="inner" class="inner">
<input type="text" name="innerInput"/>
</form>
</form>
1. form元素个数差异
IE5678、Webkit和Molliza都会排除嵌套的form元素,而IE9会保留form元素。
// IE5678、Webkit和Molliza,会排除嵌套的form元素
document.forms.length; // 返回1
// IE9,保留嵌套的form元素
document.forms.length; // 返回2
通过在Chrome的调试工具可查看Webkit解析生成的DOM树结构,是不生产嵌套的form元素的,并且将嵌套的form节点下的子节点提取 到上一级。而在IE5678下,通过调试工具发现DOM树中依然包含嵌套的form元素节点,但其下的子节点被提取到上一级。而IE9下的嵌套form节 点在DOM树中被完整的构建,因此不仅DOM中包含嵌套的form节点,而且其子节点并没有被提取到上一级。
下面代码级的验证:
// Webkit和Molliza
document.getElementsByTagName('form').length; // 1,dom树没有嵌套的form节点所以找不到
document.getElementById('inner'); // null,dom树没有嵌套的form节点所以找不到
document.getElementsByName('inner').length; // 0
document.getElementsByClassName('inner').length; // 0
// IE5678
document.getElementsByTagName('form').length; // 2,dom树有嵌套的form节点
document.getElementById('inner'); // 1,dom树有嵌套的form节点
document.getElementsByName('inner').length; // 0
2. form节点下表单节点的差异
通过 form元素.length 可获取其下的 input节点 个数,通过 form元素[{Number} 索引] 获取指定位置的 input元素 。
// Webkit和Molliza
document.form[0].length; // 2
// IE5678
document.form[0].length; // 2
document.getElementsByTagName('form')[1].length; // undefined,非嵌套的form节点.length没有input节点时返回0,而嵌套的form节点.length必定返回undefined
// IE9
document.form[0].length; // 1
document.form[1].length; // 1
写到这里我想有人会说哪有人会写嵌套form的啊,确实能写出这种html结构出来的,我也十分佩服。总结一句,真心请大伙不要嵌套form。下面我们再罗列出
下面是判断嵌套form和排除的方法,但不建议为排除嵌套form而重写document.getElementsByTagName等方法,因为会将 原来为HTMLCollection或NodeList类型的返回对象,改为没有实时同步特性的Array对象,何苦呢。。。。。。
/** IE5678中用于判断是否为嵌套form
* @method
* @param {HTMLFormElement} form
* @return {Boolean}
*/
var isNestForm = function(form){
var forms = document.forms, i = 0, curr;
for (;(curr = forms[i++], curr && curr !== form);){}
return !curr;
};
var removeNestForm = function(node){
if (node === null || typeof node === 'undefined') return null;
var ret = node;
if (node.tagName && node.tagName.toLocaleLowerCase() === 'form'){
ret = isNestForm(node) ? null : node;
}
else if (node.length){
ret = [];
for (var i = 0, len = node.length; i < len; ++i){
var tmp = node[i];
isNestForm(tmp) || ret.push(tmp);
}
}
return ret;
};
十、隐藏的武士刀二: document.links
获取文档中所有拥有href属性的a和area对象的引用。但在IE5678中 document.links是个类函数,而在Webkit和Molliza中是个HTMLCollection对象。
// IE5678、Webkit和Molliza中获取指定位置的元素对象
document.links[{Number} 索引];
// IE5678中获取指定位置的元素对象
document.links({Number} 索引);
// Webkit和Molliza中通过id或name属性值获取元素对象
document.links[{String} id或name];
// IE5678中通过id或name属性值获取元素对象
document.links({String} id或name);
十一、隐藏的武士刀三: document.scripts
获取文档中所有script对象的引用。但从IE5678到Webkit、Molliza都包含以自闭合格式声明的script对象 <script /> ,正确的声明格式是 <script></script> 。
但在IE5678中 document.scripts是个类函数,而在Webkit和Molliza中是个HTMLCollection对象。在IE5678下的具体玩法如下:
// 获取指定位置的元素对象
document.scripts[{Number} 索引];
document.scripts({Number} 索引);
十二、隐藏的武士刀四: document.styleSheets
获取文档中所有style和link的CSSStyleSheet类型对象的引用,与 document.getElementsByTagName('style')和 document.getElementsByTagName('link')获取的是HTMLStyleElement类型对象是不同的,在 IE5678中是一个类函数,Webkit和Molliza中是一个StyleSheetList类型对象(属于NodeList类型,想了解跟多 NodeList和HTMLCollection可留意另一篇《JS魔法堂:那些困扰你的DOM集合类型》)。由于涉及的边幅过大,因此打算另开一篇 《JS魔法堂:哈佬,css.js!》
十三、隐藏的武士刀五: document.anchors
获取文档中所有锚对象(HTMLAnchorElement)的引用。该方法在IE5678下返回的是一个类函数,在Webkit、Molliza下返回一个HTMLCollection对象。并且在IE5678和Webkit、Molliza的获取的锚对象个数也不同。
html
<a href="javascript: void 0;">links</a>
<a name="a1" id="b1">anchor1</a>
<a name="a1" id="b2">anchor2</a>
<a name="a3" id="b3">anchor3</a>
javascript
var anchors = document.anchors;
// IE5678
anchors.length; // 返回4,包含links
anchors[{Number|String} 索引]; // 返回指定位置的元素
anchors({String} id或name); // 返回第一个id或name匹配的元素
// Webkit、Molliza
anchors.length; // 返回3
anchors[{Number|String} 索引]; // 返回指定位置的元素
anchors[{String} id或name]; // 返回第一个id或name匹配的元素
十四、隐藏的武士刀六: document.images
获取文档中所有img的对象引用。 该方法在IE5678下返回的是一个类函数,在Webkit、Molliza下返回一个HTMLCollection对象。
十五、隐藏的武士刀七: document.embeds
获取文档中所有embed的对象引用。该方法在IE5678下返回的是一个类函数,在Webkit、Molliza下返回一个HTMLCollection对象。
十六、隐藏的武士刀八: document.applets
获取文档中所有applet的对象引用。该方法在IE5678下返回的是一个类函数,在Webkit、Molliza下返回一个HTMLCollection对象。
十七、隐藏的武士刀九: document.plugins
效果和document.embeds一样
十八、完整实现
这里对getElementById,getElementsByTagName,getElementsByName进行了封装从而继承Function,并polyfill了getElementsByClassName,并排除嵌套form的问题。
void function(global, doc){
// 选择器加工工厂对象
var nsWrapers = {};
nsWrapers.getElementById = function(node){
var host = node;
var nativeGetById = host.getElementById;
/** 修复IE567下document.geElementById会获取name属性值相同的元素
* 修复IE5678下document.geElementById没有继承Function方法的诡异行为
* @method
* @param {String} id
* @return {HTMLElementNode|Null}
*/
return function(id){
var node = nativeGetById.call(host, id);
if (node && node.id !== id){
var nodes = doc.all[id];
var i = 0;
for (;(node = nodes && nodes[i++] || null, node && node.id !== id);){}
}
wraperFactory(node);
return node;
};
};
nsWrapers.getElementsByName = function(node){
var host = node;
var nativeGetByName = host.getElementsByName;
/** 修复IE5678下document.geElementsByName没有继承Function方法的诡异行为
* @method
*/
return function(tag){
var nodes = nativeGetByName.call(host, tag);
wraperFactory(nodes);
return nodes;
};
};
nsWrapers.getElementsByTagName = function(node){
var host = node;
var nativeGetByTagName = host.getElementsByTagName;
/** 修复IE5678下document.geElementsByTagName没有继承Function方法的诡异行为
* @method
*/
return function(tag){
var nodes = nativeGetByTagName.call(host, tag);
wraperFactory(nodes);
return nodes;
};
};
nsWrapers.getElementsByClassName = function(node){
var host = node;
return function(cls){
var r = new RegExp('\\b' + cls + '\\b', 'i');
var seed = host.all, i = 0, nodes = [], node;
while (node = seed[i++]){
if (node.nodeType === 1){
node.className.search(r) >= 0 && nodes.push(node);
}
}
wraperFactory(nodes);
return nodes;
};
};
var htmlElSelectors = ['getElementsByTagName', 'getElementsByClassName'];
var htmlDocSelectors = htmlElSelectors.concat(['getElementById', 'getElementsByName']);
var wraperFactory = function(node){
if (!node) return void 0;
if (node.tagName !== 'form' && node.length && node[0]){
for (var i = node.length - 1; i >= 0; --i){
wraperFactory(node[i]);
}
}
else{
var ns = !node.ownerDocument ? htmlDocSelectors : htmlElSelectors
, i = 0, currNS, currWraper;
while (currNS = ns[i++]){
if (currWraper = nsWrapers[currNS]){
node[currNS] = currWraper(node);
}
}
}
};
(! + [1,]) && wraperFactory(doc);
}(window, document);
其中关于通过 (!+[1,]) 判断IE5678的黑魔法我想大家早已从司徒正美的blog那听闻过了,但底层到底是怎样换算出来的呢?我们可以通过后面的《JS魔法堂:隐式类型转换的背后》来一起探讨一下!
十九、总结
本来没想写这么多,但一边写一边找资料来尽量使内容完善,自己也得益不少。当然,内容上依旧不全面,望大家一起补充,一起探讨^_^!