详解正则表达式中的\B和\b

对于正则表达式的中\B和\b 有些地方会出现弄不懂的情况

或许你看了下面这篇博客 你就能够对\B和\b认识加深了

根据查看API可以知道 \B和\b都是边界匹配符

这里写图片描述

先说说\b这个单词边界吧!竟然想了解 首先必须清楚什么叫单词边界!我们可以以\b为分割来探究一下

单词边界

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str="(中文问号?123???英文)问号?我是华丽[的制表符\t]我是华丽{的空格符 我是华丽}的换行符\n";
      String rex="\\b";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      String [] result=pattern.split(str); 

      for(String string:result){
          System.out.println("分割的字符串:"+"["+string+"]");
      }
    }
}

运行结果

分割的字符串:[(]
分割的字符串:[中文问号]
分割的字符串:[?]
分割的字符串:[123]
分割的字符串:[???]
分割的字符串:[英文]
分割的字符串:[)]
分割的字符串:[问号]
分割的字符串:[?]
分割的字符串:[我是华丽]
分割的字符串:[[]
分割的字符串:[的制表符]
分割的字符串:[    ]]
分割的字符串:[我是华丽]
分割的字符串:[{]
分割的字符串:[的空格符]
分割的字符串:[ ]
分割的字符串:[我是华丽]
分割的字符串:[}]
分割的字符串:[的换行符]
分割的字符串:[
]

从这些分割的字符串中我们可以知道单词边界就是单词和符号之间的边界

这里的单词可以是中文字符,英文字符,数字;符号可以是中文符号,英文符号,空格,制表符,换行

下面我们看一个例子

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str=" 2 ";
      String rex="\\b2\\b";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      if(matcher.matches()){
          System.out.println("匹配成功");
      }else{
          System.out.println("匹配不成功");
      }
    }
}

在没有看上面分割的例子前估计很多人包括我都会认为这运行的结果是匹配成功

经过分割的例子后就知道了 空格并不是边界 空格与数字2之间的那个才叫边界 所以运行结果不言而喻 肯定是匹配不成功

当如果你这样写就运行出来就是匹配成功

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str="2";
      String rex="\\b2\\b";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      if(matcher.matches()){
          System.out.println("匹配成功");
      }else{
          System.out.println("匹配不成功");
      }
    }
}

\b的用法

一般来说\b不用来判断当前字符串是否符合某种规则

一般我们都用\b来进行获取

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str=",,,,呵呵,,,,";
      String rex="\\b呵呵\\b";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      if(matcher.find()){
          System.out.println(matcher.group());
      }
    }
}

运行结果

呵呵

\B的用法

了解了\b的用法 我们再来说说\B \B是非单词边界

也就说\B=[^\b]//符号^是非的意思

\b是单词与符号的边界 那非单词与符号的边界的其它都是\B

所以我们的猜想\B是符号与符号,单词与单词的边界

当然猜想需要认证!下面我们写一个例子来证明一个!

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str="123456我是JAVA{,、;‘asd";
      String rex="\\B";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      String [] result=pattern.split(str);

      for(String string:result){
          System.out.println("分割的字符串:"+string);
      }
    }
}

运行结果

分割的字符串:1
分割的字符串:2
分割的字符串:3
分割的字符串:4
分割的字符串:5
分割的字符串:6
分割的字符串:我
分割的字符串:是
分割的字符串:J
分割的字符串:A
分割的字符串:V
分割的字符串:A{      //单词与符号之间的边界不算\B的边界
分割的字符串:,
分割的字符串:、
分割的字符串:;
分割的字符串:‘a
分割的字符串:s
分割的字符串:d

事实证明\B作为非单词边界 确实是单词与单词,符号与符号之间的边界

\B一般也是用来获取字符串的

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class matcher1 {
    public static void main(String[] args) {
      String str=",,,,,和呵呵,,,,,";
      String rex="\\B呵\\B";

      Pattern pattern=Pattern.compile(rex);
      Matcher matcher=pattern.matcher(str);

      if(matcher.find()){
          System.out.println(matcher.group());
      }

    }
}

因为字符与字符之间的边界

所以运行的结果是

END!!!!!!!!!!!!!!!

  • 19
    点赞
  • 32
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
### 回答1: 好的,我可以回答你关于Python正则表达式的问题。 Python正则表达式是一种用来匹配和处理字符串的工具。它可以在字符串搜索和匹配特定的模式,以实现更高效和精确的数据处理。Python的re模块提供了完整的正则表达式支持,并且非常强大和灵活。 使用Python正则表达式,你可以实现各种字符串操作,比如搜索、替换、分割、提取等等。它的语法相对简单,但是功能非常强大,可以满足大部分的字符串处理需求。 在使用Python正则表达式时,你需要掌握一些基本的语法规则,比如元字符、字符集、重复、分组等等。这些语法规则可以组合在一起,形成复杂的匹配模式,以实现更加精细的字符串处理。 总之,Python正则表达式是一种非常有用的工具,可以大大提高字符串处理的效率和精确度。如果你想深入了解它的用法和技巧,可以查看Python官方文档关于re模块的详细说明。 ### 回答2: Python正则表达式是一种强大的文本匹配和处理工具,通过使用特定的模式来识别和操作文本的字符串。正则表达式通常被用于从文本提取特定的信息、验证输入的有效性、进行替换或搜索等操作。 Python正则表达式的语法使用元字符和特殊字符来定义搜索模式,其元字符用于描述字符类型或位置,特殊字符用于描述重复次数或匹配方式。常见的元字符包括"."(匹配任意字符)、"\d"(匹配数字字符)、"\w"(匹配字母、数字或下划线字符)、"\s"(匹配空白字符)等。特殊字符包括"*"(匹配前面的模式0次或多次)、"+"(匹配前面的模式1次或多次)、"?"(匹配前面的模式0次或1次),以及花括号{}(指定前面模式的重复次数)等。 使用Python正则表达式时,常见的操作包括匹配、搜索、替换和分割。匹配操作通过`re.match()`或`re.search()`函数实现,用于从字符串的起始位置或任意位置开始匹配;搜索操作通过`re.findall()`或`re.finditer()`函数实现,用于在整个字符串搜索匹配的内容;替换操作通过`re.sub()`函数实现,用于替换匹配到的内容;分割操作通过`re.split()`函数实现,用于按指定的模式分割字符串。 Python正则表达式还支持分组、捕获、非捕获、反向引用等高级特性,可通过使用括号`()`进行分组,并使用`\number`的方式引用分组匹配到的内容。 总而言之,Python正则表达式提供了一套强大且灵活的工具来处理文本匹配和处理的需求。学习和熟练掌握正则表达式的使用,对于处理和分析文本数据将大有裨益。 ### 回答3: Python正则表达式是一种用来匹配字符串模式的工具。它使用一种特殊的语法来描述字符串的模式,然后通过与给定的字符串进行比较,判断是否匹配。 在Python,我们使用re模块来使用正则表达式。首先,我们需要导入re模块,然后使用re模块提供的函数来进行匹配操作。 正则表达式的一些基本概念包括: 1. 字符组:用方括号[]表示,表示匹配其的任意一个字符。例如[abc]表示匹配字符a、b或c。 2. 量词:用来表示匹配多个字符的数量。例如*表示匹配0个或多个字符,+表示匹配1个或多个字符,?表示匹配0个或1个字符。 3. 元字符:具有特殊含义的字符,例如.表示匹配除换行符外的任意字符,\d表示匹配任意一个数字字符。 4. 转义字符:使用反斜杠\来转义元字符。例如\.表示匹配点字符。 5. 边界匹配:^表示匹配字符串的开头,$表示匹配字符串的结尾。 可以通过这些基本概念进行复杂模式的匹配。例如,使用re模块的match函数可以判断一个字符串是否以某个模式开头,使用search函数可以在字符串搜索匹配某个模式的子串,使用findall函数可以找到所有匹配的子串。 除了基本概念外,Python正则表达式还提供了一些更高级的功能,例如分组、捕获和替换等。 总之,Python正则表达式是一种强大的工具,可以用于字符串的匹配和处理。掌握正则表达式的基本语法和常用函数,可以帮助我们更高效地处理字符串操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值