正则表达式
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表通常被用来检索、替换那些符合某个模式(规则)的文本。
1.1、概念
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。
1.2、正则表达式可以做什么
给定一个正则表达式和另一个字符串,我们可以达到如下的目的:
- 给定的字符串是否符合正则表达式的过滤逻辑(称作“匹配”);
- 可以通过正则表达式,从字符串中获取我们想要的特定部分。(爬虫应用)
特点
1.可以用极简单的方式达到字符串的复杂控制
2.灵活性 逻辑性比较好
3.对于刚接触的人比较难懂
应用的对象是文本。
符号
由普通字符和一些元字符组成。
1.5、用途
(1)字符串匹配(字符匹配)
(2)字符串查找
(3)字符串替换
例如:
(1)手机号码是否符合规范等
(2)邮箱地址是否正确
(3)IP地址是否正确
对QQ号进行校验
需求:定义一个功能对QQ号进行校验
要求:长度5-15,只能是数字,0不能开头
典型的