java基础之String类与正则表达式

概述

java中用String类对字符串进行描述,定义了诸多属性和方法。

  • 常量池与引用值:

String s1 = "abc"; // s1指向的内存中只有一个对象abc,该对象存在于常量池中,s1的实际值是
String s2 = new String("abc"); // s2指向的内容实际有两个对象:常量池中的字符串abc、堆内存中new的那个对象 。其中,常量池中的对象是不可改变的,s2的实际值()是堆内存中的地址。

  • ==与equals:
    前者比较的是引用值,后者在具体类中可能被重写,String类中该方法被重写成两对象中实际字符串内容的相等与否。

System.out.println(s1==s2);//false 比较的是引用的地址值,一个指向常量池,一个指向堆内存
System.out.println(s1.equals(s2));//true  s1和s2的字符串都是abc,所以相等

字符串的方法:

1:构造方法:将字节数组或者字符数组转成字符串。

String s1 = new String();//创建了一个空内容的字符串。 
String s2 = null;//s2没有任何对象指向,是一个null常量值。
String s3 = "";//s3指向一个具体的字符串对象,只不过这个字符串中没有内容。
String s4 = new String("abc");//一般在定义字符串时,不用new。
String s5 = "abc"; //一般用此写法
new String(char[]);//将字符数组转成字符串。
new String(char[],offset,count);//将字符数组中的一部分转成字符串。

2:一般方法:

2.1 获取:(角标操作,与数组有一点相似)

  • 2.1.1:获取字符串的长度: length();
    2.1.2:指定位置的字符: char charAt(int index);
    2.1.3:获取指定字符的位置。如果不存在返回-1,所以可以通过返回值-1来判断某一个字符不存在的情况。
    • int indexOf(int ch);//返回第一次找到的字符角标
      int indexOf(int ch,int fromIndex); //返回从指定位置开始第一次找到的角标
      int indexOf(String str); //返回第一次找到的字符串角标
      int indexOf(String str,int fromIndex);
      int lastIndexOf(int ch);
      int lastIndexOf(int ch,int fromIndex);
      int lastIndexOf(String str);
      int lastIndexOf(String str,int fromIndex);

  • 2.1.4:获取子串。
    • String substring(int start);//从start位开始,到length()-1为止.
      String substring(int start,int end);//从start开始到end为止。//包含start位,不包含end位。
      substring(0,str.length());//获取整串

2.2 判断:

  • 2.2.1:字符串中包含指定的字符串吗?boolean contains(String substring);
    2.2.2:字符串是否以指定字符串开头啊?boolean startsWith(string);
    2.2.3:字符串是否以指定字符串结尾啊?boolean endsWith(string);
    2.2.4:判断字符串是否相同 boolean equals(string);//覆盖了Object中的方法,判断字符串内容是否相同。
    2.2.5:判断字符串内容是否相同,忽略大小写。boolean equalsIgnoreCase(string) ;
    2.2.6 字符串之间的比较:
    • int compareTo();//如果参数字符串等于此字符串,则返回值 0;如果此字符串按字典顺序小于字符串参数,则返回一个小于 0 的值;如果此字符串按字典顺序大于字符串参数,则返回一个大于 0 的值。

2.3 转换:

  • 2.3.1:通过构造函数可以将字符数组或者字节数组转成字符串。
    2.3.2:可以通过字符串中的静态方法,将字符数组转成字符串。
    • static String copyValueOf(char[] );
      static String copyValueOf(char[],int offset,int count);
      static String valueOf(char[]);
      static String valueOf(char[],int offset,int count);

  • 2.3.3:将基本数据类型或者对象转成字符串。
    • static String valueOf(char);
      static String valueOf(boolean);
      static String valueOf(double);
      static String valueOf(float);
      static String valueOf(int);
      static String valueOf(long);
      static String valueOf(Object);

  • 2.3.4:将字符串转成大小写。
    • String toLowerCase();
      String toUpperCase();

  • 2.3.5:将字符串转成数组。
    • char[] toCharArray();//转成字符数组。
      byte[] getBytes();//可以加入编码表。转成字节数组。

  • 2.3.6:将字符串转成字符串数组。切割方法。
    • String[] split(分割的规则-字符串);

  • 2.3.7:将字符串进行内容替换。注意:修改后变成新字符串,并不是将原字符串直接修改。
    • String replace(oldChar,newChar);
      String replace(oldstring,newstring);

  • 2.3.8: String concat(string); //对字符串进行追加。
    • String trim();//去除字符串两端的空格

工具类:StringBuffer与StringBuilder

字符串内容存在于常量池,是不能修改的,要修改时怎么办?构造一个字符串缓冲区,初始容量为 16 个字符。

1、特点:

  • 1:可以对字符串内容进行修改。
    2:是一个容器。
    3:是可变长度的。
    4:缓冲区中可以存储任意类型的数据。
    5:最终需要变成字符串。

2、常用方法:

  • 1,添加。
    StringBuffer append(data):在缓冲区中追加数据。追加到尾部。
    StringBuffer insert(index,data):在指定位置插入数据。
    2,删除。
    StringBuffer delete(start,end);删除从start至end-1范围的元素
    StringBuffer deleteCharAt(index);删除指定位置的元素
    sb.delete(0,sb.length());//清空缓冲区。
    3,修改。
    StringBuffer replace(start,end,string);将start至end-1替换成string
    void setCharAt(index,char);替换指定位置的字符
    void setLength(len);将原字符串置为指定长度的字符串
    4,查找。(查不到返回-1)
    int indexOf(string); 返回指定子字符串在此字符串中第一次出现处的索引。
    int indexOf(string,int fromIndex);从指定位置开始查找字符串
    int lastIndexOf(string); 返回指定子字符串在此字符串中最右边出现处的索引。
    int lastIndexOf(string,int fromIndex); 从指定的索引开始反向搜索
    5,获取子串。
    string substring(start); 返回start到结尾的子串
    string substring(start,end); 返回start至end-1的子串
    6,反转。StringBuffer reverse();字符串反转

3、StringBuilder

  • JDK1.5出现StringBuiler;构造一个其中不带字符的字符串生成器,初始容量为 16 个字符。该类被设计用作 StringBuffer 的一个简易替换,用在字符串缓冲区被单个线程使用的时候(这种情况很普遍)。方法和StringBuffer一样;

  • StringBuffer 和 StringBuilder 的区别:
    • StringBuffer线程安全。
      StringBuilder线程不安全。
      单线程操作,使用StringBuilder 效率高。
      多线程操作,使用StringBuffer 安全。

正则表达式

其实是用来操作字符串的一些规则。

好处:正则的出现,对字符串的复杂操作变得更为简单。
特点:将对字符串操作的代码用一些符号来表示。只要使用了指定符号,就可以调用底层的代码对字符串进行操作。符号的出现,简化了代码的书写。
弊端:符号的出现虽然简化了书写,但是却降低了阅读性。

常见操作:

  • 1,匹配:其实用的就是String类中的matches方法。

    String reg = "[1-9][0-9]{4,14}";
    boolean b = qq.matches(reg);//将正则和字符串关联对字符串进行匹配。

  • 2,切割:其实用的就是String类中的split方法。
    3,替换:其实用的就是String类中的replaceAll();
    4,获取:(利用匹配引擎来进行复杂的操作)
    • 1),先要将正则表达式编译成正则对象。使用的是Pattern中静态方法 compile(regex);

String reg = "\\b[a-z]{4}\\b";
Pattern p = Pattern.compile(reg);

    • 2),通过Pattern对象获取Matcher对象。
      通过Pattern对象中的matcher方法。该方法可以正则规则和字符串想关联。并返回匹配器对象。

Matcher m  = p.matcher(str);

    • 3),使用Matcher对象中的方法即可对字符串进行各种正则操作。

入门级正则表达式符号:

  • // 反斜杠
    /t 间隔 (‘/u0009’)
    /n 换行 (‘/u000A’)
    /r 回车 (‘/u000D’)
    /d 数字 等价于[0-9]
    /D 非数字 等价于[^0-9]
    /s 空白符号 [/t/n/x0B/f/r]
    /S 非空白符号 [^/t/n/x0B/f/r]
    /w 单独字符 [a-zA-Z_0-9]
    /W 非单独字符 [^a-zA-Z_0-9]
    /f 换页符
    /e Escape
    /b 一个单词的边界
    /B 一个非单词的边界
    /G 前一个匹配的结束

  • ^为限制开头
    ^java 条件限制为以Java为开头字符
    java 条件限制为以java为结尾字符
    . 条件限制除/n以外任意一个单独字符
    java.. 条件限制为java后除换行外任意两个字符

  • 加入特定限制条件「[]」
    [a-z] 条件限制在小写a to z范围中一个字符
    [A-Z] 条件限制在大写A to Z范围中一个字符
    [a-zA-Z] 条件限制在小写a to z或大写A to Z范围中一个字符
    [0-9] 条件限制在小写0 to 9范围中一个字符
    [0-9a-z] 条件限制在小写0 to 9或a to z范围中一个字符
    [0-9[a-z]] 条件限制在小写0 to 9或a to z范围中一个字符(交集)

  • []中加入^后加再次限制条件「[^]」
    [^a-z] 条件限制在非小写a to z范围中一个字符
    [^A-Z] 条件限制在非大写A to Z范围中一个字符
    [^a-zA-Z] 条件限制在非小写a to z或大写A to Z范围中一个字符
    [^0-9] 条件限制在非小写0 to 9范围中一个字符
    [^0-9a-z] 条件限制在非小写0 to 9或a to z范围中一个字符
    [^0-9[a-z]] 条件限制在非小写0 to 9或a to z范围中一个字符(交集)

  • 在限制条件为特定字符出现0次以上时,可以使用「*」
    J* 0个以上J
    .* 0个以上任意字符
    J.*D J与D之间0个以上任意字符

  • 在限制条件为特定字符出现1次以上时,可以使用「+」
    J+ 1个以上J
    .+ 1个以上任意字符
    J.+D J与D之间1个以上任意字符

  • 在限制条件为特定字符出现有0或1次以上时,可以使用「?」
    JA? J或者JA出现

  • 限制为连续出现指定次数字符「{a}」
    J{2} JJ
    J{3} JJJ
    文字a个以上,并且「{a,}」
    J{3,} JJJ,JJJJ,JJJJJ,???(3次以上J并存)
    文字个以上,b个以下「{a,b}」
    J{3,5} JJJ或JJJJ或JJJJJ
    两者取一「|」
    J|A J或A
    Java|Hello Java或Hello

  • 组:用小括号标示,每定义一个小括号,就是一个组,而且有自动编号,从1开始。
    只要使用组,对应的数字就是使用该组的内容。别忘了,数组要加\。
    (aaa(wwww(ccc))(eee))技巧,从左括号开始数即可。有几个左括号就是几组。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值