总结:
各行各样都会淘汰一些能力差的,不仅仅是IT这个行业,所以,不要被程序猿是吃青春饭等等这类话题所吓倒,也不要觉得,找到一份工作,就享受安逸的生活,你在安逸的同时,别人正在奋力的向前跑,这样与别人的差距也就会越来越遥远,加油,希望,我们每一个人,成为更好的自己。
-
BAT大厂面试题、独家面试工具包,
-
资料包括 数据结构、Kotlin、计算机网络、Framework源码、数据结构与算法、小程序、NDK、Flutter
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
-
echo打印”This is YanBo’s Blog!”到屏幕,然后通过”|”管道将输出作为sed的输入。
-
sed默认操作是直接复制每行输入并输出。
-
s/^/<h2>/
在行的开头(^)添加HTML的二级标题<h2>
标签。 -
分号(;)用于分割命令。
-
s/$/<\/h2>/
用于在结尾($)添加HTML二级标题</h2>
标签。 -
命令p打印受影响的一行。
-
命令q结束sed程序。
总结:
这一部分我们学习正则表达式的基础匹配,算是入门技能。接下来继续带你装逼带你飞。
三、正则表达式—边界
热身准备:
不多BB,边界这部分算是正则表达式的核心之一。断言(零宽度断言)这一词足矣。
断言(零宽度断言)标记边界,并不耗费字符,不匹配字符,匹配字符串中的位置。
字符串或者行起始与结束:
“^” 匹配行或者字符串的起始位置,或者整个文档的起始位置。
“$” 匹配行或者字符串结尾位置。
例子:
正则表达式: “^word$”
匹配字符串: word(仅有该单词的字符串,w开头,d结束)。
单词编辑与非单词边界:
“\bxxx\b” 匹配单词边界。
“\b” 是一个零宽度断言,表面上它会匹配空格或者行起始,实际上它匹配的是一个零宽度不存在的东西。
“\B” 是一个匹配非单词边界,匹配除单词之外的位置。
例子:
正则表达式: “\Ba\B”
匹配字符串: “fhrrhahhr”(类似这样的a两边不是单词边界的字符,这里匹配字符a)。
其他锚位符:
“\A” 与”^”相似,该锚位符匹配主题词的开始。这个写法不是在所有的正则表达式程序中都可以使用的,但是可以在Perl和PCRE中使用,要匹配主题词的结尾用”\Z”, 某些上下文中还可以用”\z”。
例子:
正则表达式:”\Aaaaa\Z”
匹配字串:”aaaa” (仅仅aaaa开头结尾的字符串,也即主题词开始结束)
使用元字符的字面值:
可以用”\Q”和”\E”之间的字符集匹配字符串字面值。”.^$*+?|(){}[]-“这15个元字符在正则表达式中有特殊含义,用来编写匹配模式。其中的连字符”-“在正则表达式的方括号中用来表示范围,其他情况下无特殊含义。你在正则表达式中直接输入这些字符不会显示,如果想显示这些字符本身你就需要把他放在”\Q”和”\E”之间,当然,也可以在其前面加”\”即可。
例子:
正则表达式: "\Q$\E" 或者 "\$"
匹配字符: $字符本身
实战装逼一把:
继续像上一节一样装逼,继续添加标签,继续使用linux的sed命令BB。sed中的命令(i)允许你在文件或者字符串中的某个位子之前插入文本,与(i)相反的命令是(a),他是在某个位置之后添加文本。关于sed(或者grep或者vi与vim)的实战正则表达式例子这里不给出,自行google尝试,这里重在讲解正则表达式。
总结:
学习了边界与断言(零宽度断言)。没啥总结的,开始正则表达式的精华,继续BB。
四、选择、分组和后向引用
选择操作:
选择操作可以在多个可选模式中匹配一个。譬如你想在”The android developer need fix bug on the Bug System.”中找出”the”(the, The, THE)出现过多少次,这时候就使用选择模式。
正则表达式:”(the|The|THe|THE|tHE|thE|ThE|tHe)” 或者 “(?i)the”
原始字符串:”The android developer need fix bug on the Bug System.”
匹配结果: The,the
如上正则表达式匹配所有大小写的the。
以下是其他各种选项和修饰符(注意:如下选项不实用所有正则表达式的平台):
| 选项 | 描述 | 支持平台 |
| :-- | :-- | :-- |
| (?d) | unix中的行 | java |
| (?i) | 不区分大小写 | PCRE、Perl、Java |
| (?J) | 允许重复的名字 | PCRE |
| (?m) | 多行 | PCRE、Perl、Java |
| (?s) | 单行(dotall) | PCRE、Perl、Java |
| (?u) | Unicode | java |
| (?U) | 默认最短匹配 | PCRE |
| (?x) | 忽略空格和注释 | PCRE、Perl、Java |
| (?-…) | 复原或者关闭选项 | PCRE |
子模式:
子模式是正则表达式分组中的一个或者多个分组,就是模式中的模式。多数情况,子模式中的条件能得到匹配的前提是前面的模式得到匹配,但是也有例外(譬如”(the|THE|The)”匹配THE不依赖于the,因为the会先去匹配,这个例子有三个子模式,分别是the、THE、The),子摸式写法很多种,这里只关注括弧中的子模式。
例子(子模式匹配依赖于前面的模式):
正则表达式:(t|T)h(e|E)
匹配:the、The、thE、ThE
上面例子中第二个子模式”(e|E)”依赖于第一个子模式”(t|T)”。
特别的,括弧对于子模式不是必须的!!!!!如下:
正则表达式:”\b[tT]h[eE]”
匹配:the、The、thE、ThE
以上”[tT]”字符组可以看作第一个子模式,同理第二个。
捕获分组和后向引用:
当一个模式的全部或者部分内容由一对括号分组时,他就对内容进行捕获并临时存储于内存中,可以通过后向引用重用捕获的内容,形式如下:
“\1” 、”\2” 或者 “ 1"、" 1"、"2”,捕获的n个分组。
在sed命令中只接受”\1”这种分组。
例子(使用linux的sed命令模拟后向引用):
echo "YanBo is an Android Developer!" | sed -En 's/(YanBo is) (an Android Developer)/\2 \1/p'
输出:an Android Developer YanBo is!
解释:
-E 是sed调运ERE(扩展正则表达式),因此,括号可以当作字面值来使用。
-n 覆盖打印每一行的默认设置。
捕获分组1,2进行替换。
命名分组:
命名分组就是有名字的分组。由此可以通过名字引用分组而不是数字。
命名分组语法:
| 语法 | 描述 |
| :-- | :-- |
| (?<name>...)
| 命名分组 |
| (?name...)
| 另一种命名分组方式 |
| (?P<name>...)
| Python中的命名分组 |
| \k<name>
| 在Perl中引用分组名 |
| \k'name'
| 在Perl中引用分组名 |
| \g{name}
| 在Perl中引用分组名 |
| \k{name}
| 在.NET中引用分组名 |
| (?P=name)
| 在Python中引用分组名 |
非捕获分组:**
非捕获分组不会将其内容存储在内存中。在你并不想引用分组时可以使用它。由于不存储分组,所以非捕获分组性能较高。
例子:
捕获分组的写法:”(the|THE|The)”
不需要任何后向引用可以写为:”(?:the|The|THE)”
不区分大小写:”(?i)(?:the)” 或者 “(?😦?i)the)” 或者(推荐)”(?i:the)”
原子分组:
还有一种非捕获分组时原子分组。如果你用正则表达式引擎进行回朔操作,这种分组可以关闭回朔操作,但是他只争对原子分组部分,而不是整个表达式。语法如下:
“(?>the)”
正则表达式慢的一个原因就是回朔操作。
总结:
没啥总结的,继续装逼继续飞,下面的逼格更高更嗨!!!
六、正则表达式—量词
贪心、懒惰、占有:
量词本来是贪心的。贪心量词首先会匹配整个字串,然后一个一个回退(回朔),直到找到匹配的为止。所以他最消耗资源。
懒惰的量词使用另一种策略,他从目标的起始位置开始寻找匹配,每次检查一个字符,最后尝试匹配整个字符串。想要量词变为懒惰的,必须在普通量词后添加一个问号(?)。
占有量词会覆盖整个目标然后尝试寻找匹配内容,但是只尝试一次,不会回朔。占有量词是在普通量词之后添加一个加号(+)。
正则表达式*、+、?
进行匹配:
如下基本量词默认都是贪心的。
| 语法 | 描述 |
| :-- | :-- |
| ? | 零个或者一个 |
| + | 一个或者多个 |
| * | 零个或者多个 |
例如:
正则表达式:”9+”
匹配:一个或者多个9
匹配特定次数:
如下花括弧量词是匹配最精确的量词,默认也是贪心的。
| 语法 | 描述 |
| :-- | :-- |
| {n} | 精确匹配n次 |
| {n,} | 匹配n或者更多次 |
| {m,n} | 匹配m-n次 |
| {0,1} | 与?相同,零次或一次 |
| {1,0} | 与+相同,一次或更多 |
| {0,} | 与*相同,零次或者更多 |
懒惰量词:
这个懒惰量词直接实战来说:
正则表达式:”8?”
匹配:一个或者0个8
正则表达式:”8??” (懒惰)
匹配:一个8都没匹配,因为懒惰,尽可能少。
正则表达式:”8*?” (懒惰)
匹配:一个8都没匹配,因为懒惰,尽可能少。
正则表达式:”8+?” (懒惰)
匹配:匹配了一个8。
正则表达式:”8{3,8}?” (懒惰)
匹配:匹配了三个8。
懒惰量词表:
| 语法 | 描述 |
| :-- | :-- |
| ?? | 懒惰匹配0-1次 |
| +? | 懒惰匹配1-多次 |
| *? | 懒惰匹配0-多次 |
| {n}? | 懒惰匹配多次 |
| {n,}? | 懒惰匹配n-多次 |
| {m,n}? | 懒惰匹配m-n次 |
占有量词:
占有量词表:
| 语法 | 描述 |
| :-- | :-- |
| ?+ | 占有匹配0-1次 |
| ++ | 占有匹配1-多次 |
| *+ | 占有匹配0-多次 |
| {n}+ | 占有匹配多次 |
| {n,}+ | 占有匹配n-多次 |
| {m,n}+ | 占有匹配m-n次 |
例子:
正则表达式:”1.*+”
匹配:所有的1全被高亮。
正则表达式:”.*+1”
匹配:没有匹配,因为没有回朔。
正则表达式:”.*1”
匹配:匹配末尾为1的字串,贪心模式。
总结:
这里介绍的量词算是正则表达式效率方面的精华所在,没啥解释的,继续装逼继续飞。
七、正则表达式—环视
环视是非捕获分组,也称作零宽断言。
正前瞻:
例子:
正则表达式:”(?i)aaa (?=bbb)”
原始串:”aaa ccc bbb aaa bbb ccc aaa”
匹配:只匹配第二处”aaa”。
以上就是匹配aaa,同时要求aaa单词之后紧随的是bbb。使用了正前瞻达到目的。
总结
找工作是个很辛苦的事情,而且一般周期都比较长,有时候既看个人技术,也看运气。第一次找工作,最后的结果虽然不尽如人意,不过收获远比offer大。接下来就是针对自己的不足,好好努力了。
最后为了节约大家的时间,我把我学习所用的资料和面试遇到的问题和答案都整理成了PDF文档
喜欢文章的话请关注、点赞、转发 谢谢!
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!
正则表达式:”(?i)aaa (?=bbb)”
原始串:”aaa ccc bbb aaa bbb ccc aaa”
匹配:只匹配第二处”aaa”。
以上就是匹配aaa,同时要求aaa单词之后紧随的是bbb。使用了正前瞻达到目的。
总结
找工作是个很辛苦的事情,而且一般周期都比较长,有时候既看个人技术,也看运气。第一次找工作,最后的结果虽然不尽如人意,不过收获远比offer大。接下来就是针对自己的不足,好好努力了。
最后为了节约大家的时间,我把我学习所用的资料和面试遇到的问题和答案都整理成了PDF文档
喜欢文章的话请关注、点赞、转发 谢谢!
[外链图片转存中…(img-gaNINowi-1715678130959)]
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!