javascript字母大小写转换toLocaleUpperCase，toUpperCase，toLocaleLowerCase，toLowerCase

最新推荐文章于 2024-04-18 17:53:14 发布

拿鼓思谱

最新推荐文章于 2024-04-18 17:53:14 发布

阅读量1.6k

点赞数 1

分类专栏： js方法文章标签： javascript

原文链接：http://zhubangbang.com/javascript-case-conversion-tolocaleuppercase-touppercase-tolocalelowercase-tolowercase.html

版权

js方法专栏收录该内容

9 篇文章 0 订阅

订阅专栏

toLowerCase() 方法用于把字符串转换为小写。

语法：stringObject.toLowerCase()

返回值：一个新的字符串，在其中 stringObject 的所有大写字符全部被转换为了小写字符。

toUpperCase() 方法用于把字符串转换为大写。

语法：stringObject.toUpperCase()

返回值：一个新的字符串，在其中 stringObject 的所有小写字符全部被转换为了大写字符。

js实现字母大小写转换主要是用到了四个js函数，toLocaleUpperCase，toUpperCase，toLocaleLowerCase，toLowerCase 下面就这四个实现大小写转换的js函数逐一做简单的分析。

toLocaleUpperCase 将字符串中所有的字母字符都将被转换为大写的，同时适应宿主环境的当前区域设置。
toUpperCase 将字符串中的所有字母都被转化为大写字母。
toLocaleLowerCase 将字符串所有的字母字符都被转换为小写，同时考虑到宿主环境的当前区域设置。
toLowerCase 将字符串中的字母被转换为小写字母。
我们可以看到 toLocaleUpperCase 和 toUpperCase 功能都是一样的，toLocaleLowerCase 和 toLowerCase 也是一样的功能，那么他们有什么区别呢？

（1）toLocaleUpperCase toLocaleLowerCase 这两个函数在转换字符串中的字符时，同时将适应宿主环境的当前区域设置。在大多数情况下，其结果与利用 toUpperCase toLowerCase 这两个函数所得到的结果是一样的。但是如果语言规则与常规的 Unicode 大小写映射方式冲突，那么结果就会不同。
（2）toUpperCase toLowerCase 方法不会转换字符串中的非字母字符。

在toUpperCase()函数中，字符ı会转变为I，字符ſ会变为S。在toLowerCase()函数中，字符İ会转变为i，字符K会转变为k。利用这些特性可以绕过xss的某些防御。

toUpperCase():
ı ==>I
ſ ==>S

toLowerCase():
İ ==>i
K ==>k
不如我们来fuzz一下，看看toUpperCase功能如何？

if (!String.fromCodePoint) {
    (function() {
        var defineProperty = (function() {
            // IE 8 only supports `Object.defineProperty` on DOM elements
            try {
                var object = {};
                var $defineProperty = Object.defineProperty;
                var result = $defineProperty(object, object, object) && $defineProperty;
            } catch(error) {}
            return result;
        }());
        var stringFromCharCode = String.fromCharCode;
        var floor = Math.floor;
        var fromCodePoint = function() {
            var MAX_SIZE = 0x4000;
            var codeUnits = [];
            var highSurrogate;
            var lowSurrogate;
            var index = -1;
            var length = arguments.length;
            if (!length) {
                return '';
            }
            var result = '';
            while (++index < length) {
                var codePoint = Number(arguments[index]);
                if (
                    !isFinite(codePoint) || // `NaN`, `+Infinity`, or `-Infinity`
                    codePoint < 0 || // not a valid Unicode code point
                    codePoint > 0x10FFFF || // not a valid Unicode code point
                    floor(codePoint) != codePoint // not an integer
                ) {
                    throw RangeError('Invalid code point: ' + codePoint);
                }
                if (codePoint <= 0xFFFF) { // BMP code point
                    codeUnits.push(codePoint);
                } else { // Astral code point; split in surrogate halves
                    // http://mathiasbynens.be/notes/javascript-encoding#surrogate-formulae
                    codePoint -= 0x10000;
                    highSurrogate = (codePoint >> 10) + 0xD800;
                    lowSurrogate = (codePoint % 0x400) + 0xDC00;
                    codeUnits.push(highSurrogate, lowSurrogate);
                }
                if (index + 1 == length || codeUnits.length > MAX_SIZE) {
                    result += stringFromCharCode.apply(null, codeUnits);
                    codeUnits.length = 0;
                }
            }
            return result;
        };
        if (defineProperty) {
            defineProperty(String, 'fromCodePoint', {
                'value': fromCodePoint,
                'configurable': true,
                'writable': true
            });
        } else {
            String.fromCodePoint = fromCodePoint;
        }
    }());
}
for (var j = 'A'.charCodeAt(); j <= 'Z'.charCodeAt(); j++){
    var s = String.fromCodePoint(j);
    for (var i = 0; i < 0x10FFFF; i++) {
        var e = String.fromCodePoint(i);
        if (s == e.toUpperCase() && s != e) {
            document.write("char: "+e+"<br/>");
    };
};
}

其中混入了两个奇特的字符”ı”、”ſ”。

这两个字符的“大写”是I和S。也就是说”ı”.toUpperCase() == ‘I’，”ſ”.toUpperCase() == ‘S’。通过这个小特性可以绕过一些限制。

同样，toLowerCase也有同样的字符：

这个”K”的“小写”字符是k，也就是”K”.toLowerCase() == ‘k’.

转载地址为:http://zhubangbang.com/javascript-case-conversion-tolocaleuppercase-touppercase-tolocalelowercase-tolowercase.html

拿鼓思谱

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
javascript字母大小写转换toLocaleUpperCase，toUpperCase，toLocaleLowerCase，toLowerCase

toLowerCase() 方法用于把字符串转换为小写。语法：stringObject.toLowerCase()返回值：一个新的字符串，在其中 stringObject 的所有大写字符全部被转换为了小写字符。toUpperCase() 方法用于把字符串转换为大写。语法：stringObject.toUpperCase()返回值：一个新的字符串，在其中 stringObject 的所有小写字符全部被转换为了大写字符。js实现字母大小写转换主要是用到了四个js函数，toLocaleUpperC
复制链接

扫一扫