(带区号)座机号正则_字符串处理之正则表达式(通俗易懂)

eba2dd364741a161c12b9e5b1fb1813c.png

背景图为:网易Bgwan/Lofter&&:click

写在前面

很久没有更新内容了,本篇准备介绍一些基础实用性的内容,-字符串处理之正则表达式

字符串是编程时涉及到的最多的一种数据结构,对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的Email地址,虽然可以编程提取@前后的子串,再分别判断是否是单词和域名,但这样做不但麻烦,而且代码难以复用。

正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。

我们判断一个字符串是否是合法的Email的方法是:

1.创建一个匹配Email的正则表达式;
2.用该正则表达式去匹配用户的输入来判断是否合法。

因为正则表达式也是用字符串表示的,所以,我们要首先了解如何用字符来描述字符。

版权声明CopyRight:

本内容作者:sunst,转载或引用请标明出处 ,违者追究法律责任!!!

通过本篇你会了解学习到正则表达的基本原理,以及Python(主)和Java利用正则表达式来处理一些字符串的方法案例等等。


一:正则表达式基本知识

在正则表达式中

1. 如果直接给出字符,就是精确匹配。

  • d可以匹配一个数字
  • w可以匹配一个字母或数字
  • .可以匹配任意字符

所以:

'00d'可以匹配 '007',但无法匹配 '00A''ddd'可以匹配 '010''wwd'可以匹配 'py3''py.'可以匹配 'pyc''pyo''py!'等等;

2. 要匹配变长的字符

  • *表示任意个字符(包括0个),
  • +表示至少一个字符
  • ?表示0个或1个字符
  • {n}表示n个字符
  • {n,m}表示n-m个字符

来看一个复杂的例子:d{3}s+d{3,8},我们来从左到右解读一下:

1⃣. d{3}表示匹配3个数字,例如 '010'
2⃣. s可以匹配一个空格(也包括Tab等空白符),所以 s+表示至少有一个空格,例如匹配 ' '' '等;
3⃣. d{3,8}表示3-8个数字,例如 '1234567'

综合起来,上面的正则表达式可以匹配以任意个空格隔开的带区号的电话号码

如果要匹配'010-12345'这样的号码呢?由于'-'是特殊字符,在正则表达式中,要用''转义,所以,上面的正则是d{3}-d{3,8}

但是,仍然无法匹配'010 - 12345',因为带有空格。所以我们需要更复杂的匹配方式。

二:进阶

要做更精确地匹配,可以用[]表示范围,比如:

  • [0-9a-zA-Z_]可以匹配一个数字、字母或者下划线;
  • [0-9a-zA-Z_]+可以匹配至少由一个数字、字母或者下划线组成的字符串,比如'a100''0_Z''Py3000'等等;
  • [a-zA-Z_][0-9a-zA-Z_]*可以匹配由字母或下划线开头,后接任意个由一个数字、字母或者下划线组成的字符串,也就是Python合法的变量;
  • [a-zA-Z_][0-9a-zA-Z_]{0, 19}更精确地限制了变量的长度是1-20个字符(前面1个字符+后面最多19个字符)。

A|B可以匹配A或B,所以(P|p)ython可以匹配'Python'或者'python'

^表示行的开头,^d<

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值