作者:禅与计算机程序设计艺术
1.背景介绍
1.1 什么是正则表达式?
正则表达式(英语:Regular Expression)是一个用于匹配字符串的规则字符序列。它描述了一条字符串的形状,可以用来检查一个串是否与给定的模式匹配,查找符合条件的子串、替换掉符合条件的子串或者从某个串中取出符合条件的内容等。正则表达式使用单个字符串来表示一个匹配模式,这个字符串是文本模式语言的一部分,其语法结构可通过一些简单又强大的符号来构成。
1.2 为什么要学习正则表达式?
正则表达式在开发者中应用广泛,包括搜索引擎检索、文本处理、文本编辑器及数据库查询等,所以正则表达式对于技术人员而言是非常重要的技能。一般来说,在工作中会遇到需要处理文本信息的场景,就可能需要用到正则表达式。
1.3 正则表达式相关术语
- 点(.):匹配任意字符,除了换行符。
- 星号(*):重复零次或多次前面的元素。
- 某个字符(x):匹配任何特定字符 x。
- 方括号 ([ ]):匹配指定范围内的字符,例如 [abc] 可以匹配 ‘a’, ‘b