面试题(正则匹配解析)

今天刷了一道字节面试题,题目描述如下:

我叫王大锤,是一家出版社的编辑。我负责校对投稿来的英文稿件,这份工作非常烦人,因为每天都要去修正无数的拼写错误。但是,优秀的人总能在平凡的工作中发现真理。我发现一个发现拼写错误的捷径:

  1. 三个同样的字母连在一起,一定是拼写错误,去掉一个的就好啦:比如 helllo -> hello
  2. 两对一样的字母(AABB型)连在一起,一定是拼写错误,去掉第二对的一个字母就好啦:比如 helloo -> hello
  3. 上面的规则优先“从左到右”匹配,即如果是AABBCC,虽然AABB和BBCC都是错误拼写,应该优先考虑修复AABB,结果为AABCC

我特喵是个天才!我在蓝翔学过挖掘机和程序设计,按照这个原理写了一个自动校对器,工作效率从此起飞。用不了多久,我就会出任CEO,当上董事长,迎娶白富美,走上人生巅峰,想想都有点小激动呢!
……
万万没想到,我被开除了,临走时老板对我说: “做人做事要兢兢业业、勤勤恳恳、本本分分,人要是行,干一行行一行。一行行行行行;要是不行,干一行不行一行,一行不行行行不行。” 我现在整个人红红火火恍恍惚惚的……

说实话题目描述还挺逗的,思考了一会,没有想出来怎么做,看了一位大佬(某客昵称为Lunatic201904011812400)的解析,代码如下:

public static void main(String[] args) {
        Scanner scanner = new Scanner(System.in);
        int line = scanner.nextInt();
        scanner.nextLine();
        for (int i = 0; i < line; i++) {
            System.out.println(i);
            System.out.println(scanner.nextLine().replaceAll("(.)\\1+","$1$1").replaceAll("(.)\\1(.)\\2","$1$1$2"));
        }
    }

用正则表达式来进行字符串的处理,其实想想也很正常,但是能在这种编程题想到,我觉得属实厉害。首先针对本题出现的各个表达式进行解析:

  • () 匹配 pattern 并捕获该匹配的子表达式。可以使用 $0…$9 属性从结果"匹配"集合中检索捕获的匹配。
  • . 匹配除"\r\n"之外的任何单个字符.
  • $1 取第一个**()**所捕获的内容。
  • \1匹配第一个()所捕获的内容

举例说明

以hellooo和helloo为例。

hellooo

(.)\1匹配任意内容重复两次的字符, (.)\1+匹配任意内容重复两次或者两次以上的字符 。
所以 replaceAll("(.)\1+","$1$1")作用是将任意字符重复两次或者两次以上的字符变成两个相同的字符–这个相同的字符就是$1所取的第一个()所捕获的值,$2所取的第二个()所捕获的值。(.)\1+也就是匹配到hellooo的ooo字符,$1也就是()捕获的o字符。结果就是将ooo替换成了oo。

helloo

从上述解释,不难理解(.)\1(.)\2匹配的是AABB类型的字符串。replaceAll("(.)\1(.)\2","$1$1$2"))就是将AABB类型的字符串变成AAB类型。这里需要注意的是如果是AABBCC,不会改变BBCC的格式,因为遵循从左到右的顺序先将AABB改成AAB的类型。也就不存在BBCC类型了。在这里就也就是把lloo替换成了llo。

总结

优秀的人那么多,为什么自己不是呢?加油吧,朋友。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值