Java 转移字符与字符的处理

那么这里在列上一些转义字符
 \\ 反斜杠 
\t 间隔 ('\u0009')
\n 换行 ('\u000A')
\r 回车 ('\u000D')
\d 数字 等价于 [0-9]
\D 非数字 等价于 [^0-9]
\s 空白符号 [\t\n\x0B\f\r]
\S 非空白符号 [^\t\n\x0B\f\r]
\w 单独字符 [a-zA-Z_0-9]
\W 非单独字符 [^a-zA-Z_0-9]
\f 换页符 
\e Escape
\b 一个单词的边界 
\B 一个非单词的边界 
\G 前一个匹配的结束
------------------------------------------------------------------------------------
我在应用中用到一些给大家总结一下仅供大家参考
1、如果用“.”作为分隔的话必须是如下写法String.split("\\."),这样才
能正确的分隔开不能用String.split(".");
2、如果用“|”作为分隔的话必须是如下写法String.split("\\|"),这样才
能正确的分隔开不能用String.split("|");
“.”和“|”都是转义字符必须得加"\\";
3、如果在一个字符串中有多个分隔符可以用“|”作为连字符比如“acount=?
and uu =? or n=?”,把三个都分隔出来可以用String.split("and|or");
使用String.split方法分隔字符串时分隔符如果用到一些特殊字符可能会
得不到我们预期的结果。 
我们看jdk doc中说明  
public String[] split(String regex)
 Splits this string around matches of the given regular expression. 
参数regex是一个 regular-expression的匹配模式而不是一个简单的String
他对一些特殊的字符可能会出现你预想不到的结果比如测试下面的代码
用竖线 | 分隔字符串你将得不到预期的结果
    String[] aa = "aaa|bbb|ccc".split("|");
    //String[] aa = "aaa|bbb|ccc".split("\\|"); 这样才能得到正确的结果
    for (int i = 0 ; i <aa.length ; i++ ) {
      System.out.println("--"+aa[i]); 
    } 
用竖 * 分隔字符串运行将抛出Java.util.regex.PatternSyntaxException异
常用加号 + 也是如此。
    String[] aa = "aaa*bbb*ccc".split("*");
    //String[] aa = "aaa|bbb|ccc".split("\\*"); 这样才能得到正确的结
果    
    for (int i = 0 ; i <aa.length ; i++ ) {
      System.out.println("--"+aa[i]); 
    }  显然+ * 不是有效的模式匹配规则表达式用"\\*" "\\+"转义后即可得到正
确的结果。
"|" 分隔串时虽然能够执行但是却不是预期的目的"\\|"转义后即可得到正
确的结果。
还有如果想在串中使用"\"字符则也需要转义.首先要表达"aaaa\bbbb"这个串
就应该用"aaaa\\bbbb",如果要分隔就应该这样才能得到正确结果
String[] aa = "aaa\\bbb\\bccc".split("\\\\");
 
这是获取当前简单java工程的classpath的两种方法,控制台输出如下:
path: file:/E:/LuJunXian/aotospace/ReadOffice/bin/
path2: E:\LuJunXian\aotospace\ReadOffice

可见:path使用的分隔符是斜杠:“/” ; 而path2使用的是反斜杠: "\" ;
在java语言中,“\”所代表的是转义字符,并不代表反斜杠本身,所以在java代码中想要表示反斜杠本身“\”,则需要表示为“\\”,前一个反斜杠表示转义后一个反斜杠为反斜杠本身,也就是说,如果需要在控制台通过System.Out.println()打印出一个反斜杠的话,代码需要这样写System.out.println("\\");再稍微的延伸一下,如果需要在控制台打印单引号或者双引号的话,代码是System.out.println("\"");如果不加转义字符“\”就会出现配对的错误。

在String类的方法里面,split和replace或者replaceAll会经常被用到,比如,若需要将path2的文件分隔符转换为path的类型,则需要将代码写成 path2.replaceAll("\\\\", "/"); 
为什么需要这样写呢?原因就是第一个参数是正则表达式,在正则表达式中,“\”也是转义字符,可以简单的理解为,第一个参数需要经过两次转义才能将其转化为一个普通的字符串,所以就是前两个反斜杠"\\"经过正则表达式的转换后变成"\",同理,第三个和第四个经过正则表达式转换后也变成"\",所以经过第一次转换后的第一个参数变成“\\”,第二次转义后就变成了普通的字符"\"而不是转义字符,
同样的道理:若有一段字符串:“ab||cd||1234||8569”,这串字符被“||”分隔,若是需要用split解析的话,应该写成String []strs=str.split("\\|\\|");
下表列举了其他的一些常用转义字符。

转义字符
 
意义
ASCII码值(十进制)
\a
响铃(BEL)
007
\b            
退格(BS) ,将当前位置移到前一列
008
\f
换页(FF),将当前位置移到下页开头
012
\n
换行(LF) ,将当前位置移到下一行开头
010
\r
回车(CR) ,将当前位置移到本行开头
013
\t
水平制表(HT) (跳到下一个TAB位置)
009
\v
垂直制表(VT)
011
\\
代表一个反斜线字符''\'
092
\'
代表一个单引号(撇号)字符
039
\"
代表一个双引号字符
034
\0
空字符(NULL)
000
\ddd
1到3位八进制数所代表的任意字符
三位八进制
\xhh
1到2位十六进制所代表的任意字符
二位十六进制
注意:区分,斜杠:"/" 与 反斜杠:"\" ,此处不可互换

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值