String对象是不可变的。每个看起来修改String值的方法实际上都创建了一个全新的String对象。
String对象具有只读性,所以指向它的任何引用都不可能改变它的值。若要在toString方法中使用循环,最好自己创建一个StringBuilder对象,用它来构造最终结果。用String的话会不停创建StringBuilder,所以效率低下。
若想打印对象地址,可在toString方法中添加super.toString(),指的是Object中的toString方法
当需要改变字符串的内容时,String类对象都会返回一个新的String对象。若没有发生变化,则返回指向原对象的引用。
格式化输出的%d和%f等占位符称为格式修饰符。System.out中的printf与format()是等价的。
所有新的格式化功能都有java.util.Formatter类处理。Formatter可看做一个翻译器,将格式化字符串和数据翻译成需要的结果。创建一个Formatter对象需要向其构造器传递信息,告诉他最终结果输出方向。
String.format()是一个static方法,返回String对象。
java中,\\表示插入一个正则表达式的反斜线,其后的字符具有特殊的意义。一个数字的正则表达式:\\d;\\\\普通的反斜线
?表示可能; -?表示可能有负号,但无正号。
若字符有特殊的意义,在正则表达式中需要用\\进行转义,使之成为普通字符。\W表示非单词字符。\w表示单词字符。“+”表示一个或多个
String中自带有用的正则表达式工具有split(),与替换replaceFirst方法等
* | 0个或多个 |
[abc] | 包含a、b、c的任何字符(和a|b|c作用相同) |
[^abc] | 除了abc外的任何字符 |
[a-zA-Z] | 从a到z或A到Z的任何字符 |
[abc[hij]] | 任意abchij字符,相当于或 |
[a-z&&[hij]] | 任意hij |
\s | 空白符 |
\S | 非空白符 |
\d | 数字0-9 |
\D | 非数字 |
\w | 词字符[a-zA-Z0-9] |
\W | 非词字符[^\w] |
边界匹配符
^ | 一行的开始 |
$ | 一行的结束 |
\b | 词的边界 |
\B | 非词的边界 |
\G | 前一个匹配结果 |
量词描述了一个模式吸收文本的方式:
1、贪婪型:为模式发现尽可能多的匹配
2、勉强型:用文豪来制定,满足模式所需的最少字符数,也成为懒惰型
3、占有型
贪婪型 | m勉强型 | z占有型 | p匹配方式 |
X? | X?? | X?+ | 一个或零个X |
X* | X*? | X*+ | 0或多个X |
X+ | X+? | X++ | y一个或多个X |
X{n} | X{n}? | X{n}+ | 恰好n次X |
X{n,} | X{n,}? | X{n,}+ | 至少n次X |
X{n,m} | X{n,m}? | X{n,m}+ | X至少n次,最多m次 |
检索用正则表达式的步骤:
导入java.util.regex包;用static Pattern.compile(正则表达式)编译;它会根据String类的正则表达式生成一个Pattern对象。把想检索的字符串传入Pattern对象的matcher(匹配对象)。该方法生成一个Matcher对象
组是用括号划分的正则表达式。组号为0表示整个表达式。组号为1表示第一对括号的组
正则表达式并未看完