toLowerCase() 方法用于把字符串转换为小写。
语法:stringObject.toLowerCase()
返回值:一个新的字符串,在其中 stringObject 的所有大写字符全部被转换为了小写字符。
toUpperCase() 方法用于把字符串转换为大写。
语法:stringObject.toUpperCase()
返回值:一个新的字符串,在其中 stringObject 的所有小写字符全部被转换为了大写字符。
js实现字母大小写转换主要是用到了四个js函数,toLocaleUpperCase,toUpperCase,toLocaleLowerCase,toLowerCase 下面就这四个实现大小写转换的js函数逐一做简单的分析。
toLocaleUpperCase 将字符串中所有的字母字符都将被转换为大写的,同时适应宿主环境的当前区域设置。
toUpperCase 将字符串中的所有字母都被转化为大写字母。
toLocaleLowerCase 将字符串所有的字母字符都被转换为小写,同时考虑到宿主环境的当前区域设置。
toLowerCase 将字符串中的字母被转换为小写字母。
我们可以看到 toLocaleUpperCase 和 toUpperCase 功能都是一样的,toLocaleLowerCase 和 toLowerCase 也是一样的功能,那么他们有什么区别呢?
(1)toLocaleUpperCase toLocaleLowerCase 这两个函数在转换字符串中的字符时,同时将适应宿主环境的当前区域设置。在大多数情况下,其结果与利用 toUpperCase toLowerCase 这两个函数所得到的结果是一样的。但是如果语言规则与常规的 Unicode 大小写映射方式冲突,那么结果就会不同。
(2)toUpperCase toLowerCase 方法不会转换字符串中的非字母字符。
在toUpperCase()函数中,字符ı会转变为I,字符ſ会变为S。在toLowerCase()函数中,字符İ会转变为i,字符K会转变为k。利用这些特性可以绕过xss的某些防御。
toUpperCase():
ı ==>I
ſ ==>S
toLowerCase():
İ ==>i
K ==>k
不如我们来fuzz一下,看看toUpperCase功能如何?
if (!String.fromCodePoint) {
(function() {
var defineProperty = (function() {
// IE 8 only supports `Object.defineProperty` on DOM elements
try {
var object = {};
var $defineProperty = Object.defineProperty;
var result = $defineProperty(object, object, object) && $defineProperty;
} catch(error) {}
return result;
}());
var stringFromCharCode = String.fromCharCode;
var floor = Math.floor;
var fromCodePoint = function() {
var MAX_SIZE = 0x4000;
var codeUnits = [];
var highSurrogate;
var lowSurrogate;
var index = -1;
var length = arguments.length;
if (!length) {
return '';
}
var result = '';
while (++index < length) {
var codePoint = Number(arguments[index]);
if (
!isFinite(codePoint) || // `NaN`, `+Infinity`, or `-Infinity`
codePoint < 0 || // not a valid Unicode code point
codePoint > 0x10FFFF || // not a valid Unicode code point
floor(codePoint) != codePoint // not an integer
) {
throw RangeError('Invalid code point: ' + codePoint);
}
if (codePoint <= 0xFFFF) { // BMP code point
codeUnits.push(codePoint);
} else { // Astral code point; split in surrogate halves
// http://mathiasbynens.be/notes/javascript-encoding#surrogate-formulae
codePoint -= 0x10000;
highSurrogate = (codePoint >> 10) + 0xD800;
lowSurrogate = (codePoint % 0x400) + 0xDC00;
codeUnits.push(highSurrogate, lowSurrogate);
}
if (index + 1 == length || codeUnits.length > MAX_SIZE) {
result += stringFromCharCode.apply(null, codeUnits);
codeUnits.length = 0;
}
}
return result;
};
if (defineProperty) {
defineProperty(String, 'fromCodePoint', {
'value': fromCodePoint,
'configurable': true,
'writable': true
});
} else {
String.fromCodePoint = fromCodePoint;
}
}());
}
for (var j = 'A'.charCodeAt(); j <= 'Z'.charCodeAt(); j++){
var s = String.fromCodePoint(j);
for (var i = 0; i < 0x10FFFF; i++) {
var e = String.fromCodePoint(i);
if (s == e.toUpperCase() && s != e) {
document.write("char: "+e+"<br/>");
};
};
}
其中混入了两个奇特的字符”ı”、”ſ”。
这两个字符的“大写”是I和S。也就是说”ı”.toUpperCase() == ‘I’,”ſ”.toUpperCase() == ‘S’。通过这个小特性可以绕过一些限制。
同样,toLowerCase也有同样的字符:
这个”K”的“小写”字符是k,也就是”K”.toLowerCase() == ‘k’.