JavaScript 中字符串的方法归类

1. 字符方法:charAt() 和 charCodeAt()

这两个方法都接收一个参数,即基于0的字符位置。charAt()方法以单字符字符串的形式返回给定位置的那个字符。charCodeAt() 方法返回的不是字符而是字符编码。

ECMAScript5还定义了另一个访问个别字符的方法。在支持此方法的浏览器中,可以使用方括号加数字索引来访问字符串中的特定字符。如:

var stringValue = 'Hello World!';
console.log(stringValue[1]) // e

方括号表示法访问个别字符串的语法得到了IE8及FireFox、SsFari 、Chrome 和 Opear所有版本的支持。IE7或者更早的版本会返回 undefined值。

2. 字符串操作方法:

concat()

用于将一或多个字符串拼接起来,返回拼接得到的新字符串。虽然 concat() 是专门用来拼接字符串的方法,但在实践中使用更多的还是加号操作符(+)。而且,使用加号操作符在大多数情况下都比使用 concat() 方法简便易行(特别是在拼接多个字符串的情况下)。

slice() 、substr()、substring()

这三个方法都会返回被操作字符串的一个子字符串,而且也都接受一个或两个参数。第一个参数指定子字符串的开始位置,第二个参数(在指定的情况下)表示子字符串到哪里结束。具体来说,slice() 和 substring() 的第二个参数指定的是子字符串最后一个字符后面的位置。而 substr() 的第二个参数指定的则是返回的字符个数。如果没有给这些方法传递第二个参数,则将字符串的末尾作为结束位置。与 concat() 方法一样,slice()、substr() 和 substring() 也不会修改字符串本身——它们只是返回一个基本类型的字符串值,对原始字符串没有任何影响。

在传递给这些方法的参数是负值的情况下,它们的行为就不尽相同了。其中,slice() 方法会将传入的负值与字符串的长度相加,substr() 方法将负的第一个参数加上字符串的长度,而将负的第二个参数转换为0。最后,substring() 方法会把所有的负值参数都转换为0。

3. 字符串位置方法

可以从字符串中查找子字符串的方法:indexOf() 和 lastIndexOf()。这两个方法都是从一个字符串中搜索给定的子字符串,然后返回子字符串的位置(如果没有找到该子字符串,就返回-1)。两个方法的区别在于:indexOf() 从字符串的开头向后搜索子字符串,而 lastIndexOf() 方法从字符串的末尾向前搜索子字符串。

这两个方法都接受可选的第二个参数,表示从字符串的哪个位置开始搜索。换句话说, indexOf() 会从给定的位置向后搜索,忽略该位置之前的所有字符;而 lastIndexOf() 则会从指定的位置向前搜索,忽略该位置之后的所有字符。

4. trim() 方法

ECMAScript5 为所有的字符串定义了 trim() 方法。这个方法会创建一个字符串的副本。删除前置及后缀的所有空格,然后返回结果。例如:

var stringValue = "   hello world   ";
var trimStringValue = stringValue.trim()'
alert(stringValue); // "   hello world   "
alert(trimStringValue) // "hello world"

由于 trim() 返回的是字符串的副本,所以原始字符串中的前置及后缀空格会保持不变。Chrome8+ 还支持非标准的 trimLeft() 和 trimRight() 方法,分别用于删除字符串开头和末尾的空格。

5. 字符串大小写转换方法

ECMAScript中涉及字符串大小写转换的方法由4个:toLowerCase() 、toLocalLowerCase()、toUpperCase() 和 toLocalUpperCase()。其中 toLowerCase() 和 toUpperCase() 是两个经典的方法,借鉴自 java.lang.String 中的同名方法。 而 toLocalLowerCase() 和 toLocalUpperCase() 方法则是针对特定地区的实现。对有些地区来说,针对地区的方法与其通用方法的到的结果相同,但少数语言(如土耳其语)会为 Unicode 大小写转换应用特殊的规则,这时候就必须使用针对地区的方法来保证实现正确的转换。

6. 字符串的模式匹配方法

在字符串中匹配模式主要由以下几个方法:

match():在字符串上调用这个方法,本质上与调用 RegExp 的 exec() 方法相同。 match() 方法只接受一个参数,要么是一个正则表达式,要么是一个 RegExp 对象。返回一个数组:第一项是与整个模式匹配的字符串,之后的每一项(如果有)保存着与正则表达式中的捕获组匹配的字符串。

search():参数与 match() 方法相同。返回字符串中第一个匹配项的索引;如果没有找到匹配项,则返回-1。而且,search() 方法始终是从字符串开头向后查找模式。

replace(): 这个方法接受两个参数:第一个参数可以是一个 RegExp 对象或一个字符串(这个字符串不会被转换成正则表达式),第二个参数可以是一个字符串或者一个函数。如果第一个参数是字符串,那么只会替换第一个子字符串。想要替换所有子字符串,唯一的办法就是提供一个正则表达式,而且要指定全局(g)标志。如下:

var text = "cat, bat, sat, fat";
var result = text.replace('at', 'ond');
console.log(result) // "cond, bat, sat, fat"

result = text.replace(/at/g, "ond");
console.log(result) // "cond, bond, sond, fond"

如果第二个参数是字符串,那么还可以使用一些特殊的字符序列,将正则表达式操作得到的值插入到结果字符串中。下表列出了 ECMAScript 提供的这些特殊的字符序列:

字符序列替换文本
$$$
$&匹配整个模式的子字符串。与 RegExp.lastMatch 的值相同
$’匹配的子字符串之前的子字符串。与 RegExp.leftContext 的值相同
$`匹配的子字符串之后的子字符串。与 RegExp.rightContext 的值相同
$n匹配第n个捕获组的子字符串,其中n等于0-9。例如,$1是匹配第一个捕获组的子字符串,$2是匹配第二个捕获组的子字符串,以此类推。如果正则表达式中没有定义捕获组,则使用空字符串。
$nn匹配第nn个捕获组的子字符串,其中nn等于01-99。例如,$01是匹配第一个捕获组的子字符串,$02是匹配第二个捕获组的子字符串,以此类推。如果正则表达式中没有定义捕获组,则使用空字符串

通过这些特殊的字符序列,可以使用最近一次匹配结果中的内容,如下面的例子所示。

var text = "cat, bat, sat, fat";
var result = text.replace(/(.at)/g, "word ($1)");
console.log(result) // word(cat), word(bat), word(sat), word(fat)

replace() 方法的第二个参数也可以是一个函数。在只有一个匹配项(即与模式匹配的字符串)的情况下,会向这个函数传递3个参数:模式的匹配项、模式匹配项在字符串中的位置和原始字符串。在正则表达式中定义了多个捕获组的情况下,传递给函数的参数依次是模式的匹配项、第一个捕获组的匹配项、第二个捕获组的匹配项…,但最后两个参数仍然分别是模式的匹配项在字符串中的位置和原始字符串。这个函数应该返回一个字符串,表示应该被替换的匹配项。使用函数作为 replace() 方法的第二个参数可以实现更加精细的替换操作,请看下面的例子:

function htmlEscape(text) {
    return text.replace(/[<>"&]/g, function(match, pos, originalText) {
        switch(match) {
            case "<":
                return "&lt;";
            case ">":
                return "&gt;";
            case "&":
                return "&amp;";
            case "\"":
                return "&quot;";
        }
    })
}

console.log(htmlEscape("<p class=\"greeting\">Hello world!</p>"));
// &lt;p class=&quot;greeting&quot;&gt;Hello world!&lt;/p&gt;

split(): 这个方法可以基于指定的分隔符将一个字符串分割成多个子字符串,并将结果放在一个数组里。分隔符可以是字符串,也可以是一个 RegExp 对象(这个方法不会将字符串看成正则表达式)。 split()方法可以接受可选的第二个参数,用于指定数组的大小,以便确保返回的数组不会超过既定大小。

7. localCompare() 方法

这个方法比较两个字符串,并返回下列之中的一个:
如果字符串在字谜表中应该排在字符串参数之前,则返回一个负数(大多数情况下是-1,具体的值要视实现而定);
如果字符串等于字符串参数,则返回0;
如果字符串在字母表中应该排在字符串参数之后,则返回一个正数(大多数情况下是1,具体的值同样要视实现而定)。

var stringValue = "yellow";

console.log(stringValue.localCompare("brick")); // 1;
console.log(stringValue.localCompare("yellow")); // 0;
console.log(stringValue.localCompare("zoo")); // -1

localCompare() 方法比较与众不同的地方,就是实现所支持的地区(国家和语言)决定了这个方法的行为,比如,美国以英语作为 ECMAScript 实现的标准语言,因此 localCompare() 方法就是区分大小写的,域是大写字母在字母表中排在小写字母前头就成为一项决定性的比较规则。不过,在其他地区恐怕就不是这种情况了。

8. fromCharCode() 方法

这个方法的任务是接受一或多个字符编码,然后将它们将转换成一个字符串。从本质上来看,这个方法与实例方法 cherCodeAt() 执行的相反的操作。例如:

console.log(String.formCharCode(104, 101, 108, 108, 111));
// "hello"

这里我们给 fromCharCode() 方法传递的是字符串 “hello” 中每个字母的字符编码。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值