2024年Android最新正则表达式基础，什么叫面试八股文

最新推荐文章于 2024-06-28 01:16:57 发布

2401_84563287

最新推荐文章于 2024-06-28 01:16:57 发布

阅读量565

点赞数 17

分类专栏：程序员文章标签： android 面试学习

本文链接：https://blog.csdn.net/2401_84563287/article/details/138862401

版权

程序员专栏收录该内容

190 篇文章 1 订阅

订阅专栏

总结：

各行各样都会淘汰一些能力差的，不仅仅是IT这个行业，所以，不要被程序猿是吃青春饭等等这类话题所吓倒，也不要觉得，找到一份工作，就享受安逸的生活，你在安逸的同时，别人正在奋力的向前跑，这样与别人的差距也就会越来越遥远，加油，希望，我们每一个人，成为更好的自己。

BAT大厂面试题、独家面试工具包,
资料包括数据结构、Kotlin、计算机网络、Framework源码、数据结构与算法、小程序、NDK、Flutter

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

echo打印”This is YanBo’s Blog!”到屏幕，然后通过”|”管道将输出作为sed的输入。
sed默认操作是直接复制每行输入并输出。
s/^/<h2>/在行的开头(^)添加HTML的二级标题<h2>标签。
分号(;)用于分割命令。
s/$/<\/h2>/用于在结尾($)添加HTML二级标题</h2>标签。
命令p打印受影响的一行。
命令q结束sed程序。

总结：

这一部分我们学习正则表达式的基础匹配，算是入门技能。接下来继续带你装逼带你飞。

三、正则表达式—边界

热身准备：

不多BB，边界这部分算是正则表达式的核心之一。断言（零宽度断言）这一词足矣。

断言（零宽度断言）标记边界，并不耗费字符，不匹配字符，匹配字符串中的位置。

字符串或者行起始与结束：

“^” 匹配行或者字符串的起始位置，或者整个文档的起始位置。

“$” 匹配行或者字符串结尾位置。

例子：

正则表达式： “^word$”

匹配字符串： word（仅有该单词的字符串，w开头，d结束）。

单词编辑与非单词边界：

“\bxxx\b” 匹配单词边界。

“\b” 是一个零宽度断言，表面上它会匹配空格或者行起始，实际上它匹配的是一个零宽度不存在的东西。

“\B” 是一个匹配非单词边界，匹配除单词之外的位置。

例子：

正则表达式： “\Ba\B”

匹配字符串： “fhrrhahhr”(类似这样的a两边不是单词边界的字符，这里匹配字符a)。

其他锚位符：

“\A” 与”^”相似，该锚位符匹配主题词的开始。这个写法不是在所有的正则表达式程序中都可以使用的，但是可以在Perl和PCRE中使用，要匹配主题词的结尾用”\Z”, 某些上下文中还可以用”\z”。

例子：

正则表达式：”\Aaaaa\Z”

匹配字串：”aaaa” (仅仅aaaa开头结尾的字符串，也即主题词开始结束)

使用元字符的字面值：

可以用”\Q”和”\E”之间的字符集匹配字符串字面值。”.^$*+?|(){}[]-“这15个元字符在正则表达式中有特殊含义，用来编写匹配模式。其中的连字符”-“在正则表达式的方括号中用来表示范围，其他情况下无特殊含义。你在正则表达式中直接输入这些字符不会显示，如果想显示这些字符本身你就需要把他放在”\Q”和”\E”之间，当然，也可以在其前面加”\”即可。

例子：

正则表达式： "\Q$\E" 或者 "\$"

匹配字符： $字符本身

实战装逼一把：

继续像上一节一样装逼，继续添加标签，继续使用linux的sed命令BB。sed中的命令(i)允许你在文件或者字符串中的某个位子之前插入文本，与(i)相反的命令是(a)，他是在某个位置之后添加文本。关于sed（或者grep或者vi与vim）的实战正则表达式例子这里不给出，自行google尝试，这里重在讲解正则表达式。

总结：

学习了边界与断言（零宽度断言）。没啥总结的，开始正则表达式的精华，继续BB。

四、选择、分组和后向引用

选择操作：

选择操作可以在多个可选模式中匹配一个。譬如你想在”The android developer need fix bug on the Bug System.”中找出”the”（the, The, THE）出现过多少次，这时候就使用选择模式。

正则表达式：”(the|The|THe|THE|tHE|thE|ThE|tHe)” 或者 “(?i)the”

原始字符串：”The android developer need fix bug on the Bug System.”

匹配结果： The，the

如上正则表达式匹配所有大小写的the。

以下是其他各种选项和修饰符(注意：如下选项不实用所有正则表达式的平台)：

| 选项 | 描述 | 支持平台 |

| :-- | :-- | :-- |

| (?d) | unix中的行 | java |

| (?i) | 不区分大小写 | PCRE、Perl、Java |

| (?J) | 允许重复的名字 | PCRE |

| (?m) | 多行 | PCRE、Perl、Java |

| (?s) | 单行(dotall) | PCRE、Perl、Java |

| (?u) | Unicode | java |

| (?U) | 默认最短匹配 | PCRE |

| (?x) | 忽略空格和注释 | PCRE、Perl、Java |

| (?-…) | 复原或者关闭选项 | PCRE |

子模式：

子模式是正则表达式分组中的一个或者多个分组，就是模式中的模式。多数情况，子模式中的条件能得到匹配的前提是前面的模式得到匹配，但是也有例外（譬如”(the|THE|The)”匹配THE不依赖于the，因为the会先去匹配，这个例子有三个子模式，分别是the、THE、The），子摸式写法很多种，这里只关注括弧中的子模式。

例子（子模式匹配依赖于前面的模式）：

正则表达式：(t|T)h(e|E)

匹配：the、The、thE、ThE

上面例子中第二个子模式”(e|E)”依赖于第一个子模式”(t|T)”。

特别的，括弧对于子模式不是必须的！！！！！如下：

正则表达式：”\b[tT]h[eE]”

匹配：the、The、thE、ThE

以上”[tT]”字符组可以看作第一个子模式，同理第二个。

捕获分组和后向引用：

当一个模式的全部或者部分内容由一对括号分组时，他就对内容进行捕获并临时存储于内存中，可以通过后向引用重用捕获的内容，形式如下：

“\1” 、”\2” 或者 “ 1"、" 1"、"2”，捕获的n个分组。

在sed命令中只接受”\1”这种分组。

例子（使用linux的sed命令模拟后向引用）：

echo "YanBo is an Android Developer!" | sed -En 's/(YanBo is) (an Android Developer)/\2 \1/p'

输出：an Android Developer YanBo is!

解释：

-E 是sed调运ERE（扩展正则表达式），因此，括号可以当作字面值来使用。

-n 覆盖打印每一行的默认设置。

捕获分组1,2进行替换。

命名分组：

命名分组就是有名字的分组。由此可以通过名字引用分组而不是数字。

命名分组语法：

| 语法 | 描述 |

| :-- | :-- |

| (?<name>...) | 命名分组 |

| (?name...) | 另一种命名分组方式 |

| (?P<name>...) | Python中的命名分组 |

| \k<name> | 在Perl中引用分组名 |

| \k'name' | 在Perl中引用分组名 |

| \g{name} | 在Perl中引用分组名 |

| \k{name} | 在.NET中引用分组名 |

| (?P=name) | 在Python中引用分组名 |

非捕获分组：**

非捕获分组不会将其内容存储在内存中。在你并不想引用分组时可以使用它。由于不存储分组，所以非捕获分组性能较高。

例子：

捕获分组的写法：”(the|THE|The)”

不需要任何后向引用可以写为：”(?:the|The|THE)”

不区分大小写：”(?i)(?:the)” 或者 “(?😦?i)the)” 或者（推荐）”(?i:the)”

原子分组：

还有一种非捕获分组时原子分组。如果你用正则表达式引擎进行回朔操作，这种分组可以关闭回朔操作，但是他只争对原子分组部分，而不是整个表达式。语法如下：

“(?>the)”

正则表达式慢的一个原因就是回朔操作。

总结：

没啥总结的，继续装逼继续飞，下面的逼格更高更嗨！！！

六、正则表达式—量词

贪心、懒惰、占有：

量词本来是贪心的。贪心量词首先会匹配整个字串，然后一个一个回退（回朔），直到找到匹配的为止。所以他最消耗资源。

懒惰的量词使用另一种策略，他从目标的起始位置开始寻找匹配，每次检查一个字符，最后尝试匹配整个字符串。想要量词变为懒惰的，必须在普通量词后添加一个问号(？)。

占有量词会覆盖整个目标然后尝试寻找匹配内容，但是只尝试一次，不会回朔。占有量词是在普通量词之后添加一个加号(+)。

**正则表达式`*、+、?`进行匹配：**

如下基本量词默认都是贪心的。

| 语法 | 描述 |

| :-- | :-- |

| ? | 零个或者一个 |

| + | 一个或者多个 |

| * | 零个或者多个 |

例如：

正则表达式：”9+”

匹配：一个或者多个9

匹配特定次数：

如下花括弧量词是匹配最精确的量词，默认也是贪心的。

| 语法 | 描述 |

| :-- | :-- |

| {n} | 精确匹配n次 |

| {n,} | 匹配n或者更多次 |

| {m,n} | 匹配m-n次 |

| {0,1} | 与？相同，零次或一次 |

| {1,0} | 与+相同，一次或更多 |

| {0,} | 与*相同，零次或者更多 |

懒惰量词：

这个懒惰量词直接实战来说：

正则表达式：”8?”

匹配：一个或者0个8

正则表达式：”8?？” (懒惰)

匹配：一个8都没匹配，因为懒惰，尽可能少。

正则表达式：”8*？” (懒惰)

匹配：一个8都没匹配，因为懒惰，尽可能少。

正则表达式：”8+？” (懒惰)

匹配：匹配了一个8。

正则表达式：”8{3,8}？” (懒惰)

匹配：匹配了三个8。

懒惰量词表：

| 语法 | 描述 |

| :-- | :-- |

| ?? | 懒惰匹配0-1次 |

| +? | 懒惰匹配1-多次 |

| *? | 懒惰匹配0-多次 |

| {n}? | 懒惰匹配多次 |

| {n,}? | 懒惰匹配n-多次 |

| {m,n}? | 懒惰匹配m-n次 |

占有量词：

占有量词表：

| 语法 | 描述 |

| :-- | :-- |

| ?+ | 占有匹配0-1次 |

| ++ | 占有匹配1-多次 |

| *+ | 占有匹配0-多次 |

| {n}+ | 占有匹配多次 |

| {n,}+ | 占有匹配n-多次 |

| {m,n}+ | 占有匹配m-n次 |

例子：

正则表达式：”1.*+”

匹配：所有的1全被高亮。

正则表达式：”.*+1”

匹配：没有匹配，因为没有回朔。

正则表达式：”.*1”

匹配：匹配末尾为1的字串，贪心模式。

总结：

这里介绍的量词算是正则表达式效率方面的精华所在，没啥解释的，继续装逼继续飞。

七、正则表达式—环视

环视是非捕获分组，也称作零宽断言。

正前瞻：

例子：

正则表达式：”(?i)aaa (?=bbb)”

原始串：”aaa ccc bbb aaa bbb ccc aaa”

匹配：只匹配第二处”aaa”。

以上就是匹配aaa，同时要求aaa单词之后紧随的是bbb。使用了正前瞻达到目的。

总结

找工作是个很辛苦的事情，而且一般周期都比较长，有时候既看个人技术，也看运气。第一次找工作，最后的结果虽然不尽如人意，不过收获远比offer大。接下来就是针对自己的不足，好好努力了。

最后为了节约大家的时间，我把我学习所用的资料和面试遇到的问题和答案都整理成了PDF文档

喜欢文章的话请关注、点赞、转发谢谢！

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取

正则表达式：”(?i)aaa (?=bbb)”

原始串：”aaa ccc bbb aaa bbb ccc aaa”

匹配：只匹配第二处”aaa”。

以上就是匹配aaa，同时要求aaa单词之后紧随的是bbb。使用了正前瞻达到目的。

总结

最后为了节约大家的时间，我把我学习所用的资料和面试遇到的问题和答案都整理成了PDF文档

喜欢文章的话请关注、点赞、转发谢谢！

[外链图片转存中…(img-gaNINowi-1715678130959)]

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友，可以戳这里获取

2401_84563287

关注

17
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
2024年Android最新正则表达式基础，什么叫面试八股文

找工作是个很辛苦的事情，而且一般周期都比较长，有时候既看个人技术，也看运气。第一次找工作，最后的结果虽然不尽如人意，不过收获远比offer大。接下来就是针对自己的不足，好好努力了。最后为了节约大家的时间，我把我学习所用的资料和面试遇到的问题和答案都整理成了PDF文档网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化学习资料的朋友，可以戳这里获取一个人可以走的很快，但一群人才能走的更远！
复制链接

扫一扫